计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1767|回复 Reply: 11
打印 Print 上一主题 Last thread 下一主题 Next thread

[Python] SobKo:Sob子—以MCP本地部署Sobereva老师

  [复制链接 Copy URL]

38

帖子

6

威望

529

eV
积分
687

Level 4 (黑子)

摘要:今天的 Agent 已经很擅长写代码、改文件与跑脚本等功能,但在专业领域里仍然容易遇到:小众专业领域知识匮乏;回答缺少可追溯来源等问题。为解决该问题,提出Sobko(Sob子),一个面向理论计算的 Agent 的本地 MCP 知识库服务。它把国内理论计算最大开源社区“计算化学公社 / 思想家公社”中的学术经验帖,以及 Multiwfn 用户手册整理成可检索、可溯源、可迁移的知识库,让 Codex、Claude Code 等 Agent 能更快接入理论计算领域知识。

1. 项目构建流程
Sobko 的构建过程可以理解为:收集知识源、标准化切块、建立索引、封装成 MCP 工具。基于爬虫技术,搜集577 篇思想家公社学术帖(截止到2026年4月)与Multiwfn 用户手册,形成原始数据库,构建流程如下图所示:


Sobko非常适合以下使用场景:
- 想让Codex / Claude Code等Agent助手回答计算化学问题时带来源;
- 想把论坛经验帖和软件手册做成本地可检索知识库;
- 想用 MCP 方式把专业知识库插到不同 Agent 里。
- 让 Agent 不再只靠模型记忆回答专业问题,而是先查证据,再组织答案。

Sobko 目前提供 4 个 MCP 工具:


2. 知识来源
Sobko 只使用两类知识源:思想家公社学术帖和 Multiwfn 用户手册。其中思想家公社帖子经过分类、清洗和标准化后进入知识库,Multiwfn 手册则转化为Markdown形式进行存储,下图展示了搜集的搜集的思想家公社学术帖:

可以看到,2015年之后,Sob老师每年会产出约50篇高质量的帖子,不仅包含了高质量的学术内容,还包括了专业的ACG杂谈点评。接下来,统计了不同帖子的主题类型,发现Multiwfn以及量子化学计算相关技术,是Sob老师最专业的方向:


3. 使用方法
github项目仓库(https://github.com/WangGroupFDU/Sobko_MCP_project)给出了详细的使用方法,也可以利用现在的编程Agent自动为你安装


4. 性能测试(基于Codex)




(剩余省略)



202606042308455472..png (6.9 KB, 下载次数 Times of downloads: 15)

202606042308455472..png

202606042307118170..png (587.45 KB, 下载次数 Times of downloads: 11)

202606042307118170..png

202606042258438801..png (411.51 KB, 下载次数 Times of downloads: 13)

202606042258438801..png

202606042258087593..png (458.54 KB, 下载次数 Times of downloads: 11)

202606042258087593..png

202606042257498036..png (304.05 KB, 下载次数 Times of downloads: 12)

202606042257498036..png

202606042256031647..png (86.84 KB, 下载次数 Times of downloads: 11)

202606042256031647..png

评分 Rate

参与人数
Participants 32
威望 +2 eV +140 收起 理由
Reason
yaonaite + 5 牛!
chemfree + 1 好物!
北大-陶豫 + 5 牛!
Tanghaoru + 5 GJ!
littleugly + 5 谢谢
wang7344412 + 5 GJ!
djjj148 + 5 好物!
Novice + 3 赞!
jllysmj + 4 精品内容
麦小登 + 5 好物!
yflchx + 5
ABetaCarw + 5 谢谢
别说离开我 + 5 牛!
joeson + 5 不明觉厉
萧瑟 + 5 好物!
TretopL + 5 好物!
K1ro + 2 233333
jzeng + 5 赞!
Mango + 2 牛!
zsu007 + 5 谢谢分享

查看全部评分 View all ratings

复旦大学 高分子科学系 博士在读 理论计算与人工智能方向
谷歌学术:https://scholar.google.com/citations?user=s4Z-rWoAAAAJ&hl=zh-CN

546

帖子

3

威望

6863

eV
积分
7469

Level 6 (一方通行)

2#
发表于 Post on 2026-6-7 19:34:51 | 只看该作者 Only view this author
感谢楼主
我让AI自己理解和安装你的github上面的内容,然后开启hybrid检索,这个过程让我在本地构建了完整的知识库生成和查询的功能。然后我直接让AI将sobko作为模板构建新的知识库并且导入了自行收集的其他资料。这个至少省去了我一周的摸索时间,本地知识库涉及的知识可以后面慢慢补,现在已经先用上了。
恍惚月余,深谙人与人之间的差距。以后还应努力学习,才能与强者比肩。

7

帖子

0

威望

214

eV
积分
221

Level 3 能力者

3#
发表于 Post on 2026-6-7 19:44:07 | 只看该作者 Only view this author
今天试了一下用WorkBuddy也可以配置Agent

12

帖子

0

威望

141

eV
积分
153

Level 3 能力者

4#
发表于 Post on 2026-6-8 09:03:13 | 只看该作者 Only view this author
本帖最后由 Gwofan 于 2026-6-14 11:58 编辑

好物

443

帖子

8

威望

4506

eV
积分
5109

Level 6 (一方通行)

石墨

5#
发表于 Post on 2026-6-10 20:46:26 | 只看该作者 Only view this author
做得很好,但sob子还是笑死我了哈哈哈哈

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
LittlePupil + 1 我很赞同

查看全部评分 View all ratings

自在飞花轻似梦,无边丝雨细如愁。

全自动反应动力学(ReaxFF、AIMD、NEP等)后处理工具网页版:http://cc-portal.xyz/reax_tools

348

帖子

1

威望

1861

eV
积分
2229

Level 5 (御坂)

6#
发表于 Post on 2026-6-13 08:59:53 | 只看该作者 Only view this author
游客,本帖隐藏的内容需要积分高于 500 才可浏览,您当前积分为 0

8

帖子

0

威望

287

eV
积分
295

Level 3 能力者

7#
发表于 Post on 2026-6-13 11:06:43 | 只看该作者 Only view this author
感谢楼主,简单试了一下非常好。
但是安装时候发现了一点问题,我本人不太懂agent工具的配置,以下是codex自己总结的问题和解决方案:
“我在 macOS + Codex v0.140.0-alpha.2 上按 README 安装测试,python -m unittest discover -s tests 和 python scripts/smoke_mcp.py 都能通过,但按示例加 SOBKO_FORCE_BUILTIN_MCP=1 注册到 Codex 后,Codex 端一直提示 MCP handshake/startup timeout,工具没有暴露出来。
后来我安装了官方 mcp Python 包,并去掉 SOBKO_FORCE_BUILTIN_MCP=1 让它走 FastMCP,Codex 就能发现 sobko_search 等工具了。想请问一下,当前 README 推荐的内置 MCP server 是否可能和新版 Codex 的 MCP client 有兼容性问题?”

359

帖子

2

威望

4748

eV
积分
5147

Level 6 (一方通行)

8#
发表于 Post on 2026-6-13 23:54:42 | 只看该作者 Only view this author
棒极了

38

帖子

6

威望

529

eV
积分
687

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2026-6-14 19:32:24 | 只看该作者 Only view this author
xxsxb1 发表于 2026-6-13 11:06
感谢楼主,简单试了一下非常好。
但是安装时候发现了一点问题,我本人不太懂agent工具的配置,以下是codex ...

目前MCP就是要基于官方MCP python包实现的哈,如果没装这个就会产生识别不了等问题~
复旦大学 高分子科学系 博士在读 理论计算与人工智能方向
谷歌学术:https://scholar.google.com/citations?user=s4Z-rWoAAAAJ&hl=zh-CN

74

帖子

0

威望

1204

eV
积分
1278

Level 4 (黑子)

10#
发表于 Post on 2026-6-15 00:13:25 | 只看该作者 Only view this author
这回真人手一个社长了

151

帖子

1

威望

4308

eV
积分
4479

Level 6 (一方通行)

11#
发表于 Post on 2026-6-15 13:08:22 | 只看该作者 Only view this author
sobereva.com 页面写明了「从未向任何个人或组织授权转载过,严禁以任何形式转载文章内容」,你这把全站内容爬虫、做镜像、搬到 github 显然是违反著作权的

像这种公网上的信息,直接检索就能得到,为什么还要做本地化处理,我觉得不能是为了用 AI 工具而用
十八介姑娘一蕾花呀,白白介牙齿、红红介嘴唇,得人惜

2

帖子

0

威望

378

eV
积分
380

Level 3 能力者

12#
发表于 Post on 4 day ago | 只看该作者 Only view this author
王二葛 发表于 2026-6-15 13:08
sobereva.com 页面写明了「从未向任何个人或组织授权转载过,严禁以任何形式转载文章内容」,你这把全站内 ...

我看sob老师也点赞,应该授权了把

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-6-26 03:43 , Processed in 3.037900 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list