计算化学公社

 找回密码 Forget password
 注册 Register
Views: 908|回复 Reply: 5
打印 Print 上一主题 Last thread 下一主题 Next thread

[灌水] deepseek-R1 能为量化做什么?

[复制链接 Copy URL]

124

帖子

0

威望

1676

eV
积分
1800

Level 5 (御坂)

跳转到指定楼层 Go to specific reply
楼主
   如今DeepSeek R1 推理模型出来,不知道大家认为量化这块训练这模型有何策略?

1万

帖子

0

威望

8988

eV
积分
20736

Level 6 (一方通行)

2#
发表于 Post on 2025-2-13 17:03:29 | 只看该作者 Only view this author
用DeepSeek自动投计算、监测计算进程、分析报错信息并且重新投计算,我觉得会是一个值得做的方向
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?hl=zh-CN&user=XW6C6eQAAAAJ&view_op=list_works&sortby=pubdate
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1034/1702.htm
本团队长期招收研究生,有意者可私信联系

887

帖子

3

威望

1669

eV
积分
2616

Level 5 (御坂)

傻傻的木瓜

3#
发表于 Post on 2025-2-13 19:25:17 | 只看该作者 Only view this author
说训练模型的策略,除了公认重要的文章,还得把社长博客和本论坛的优质内容的权重提高个几倍吧()

其实有点好奇,能不能先通过训练AI识别构建模型结构,在提交计算之前就解决各种简单问题,比如有机小分子没加氢、几何构型明显偏离常识、与溶剂相互作用显著的溶质没做显式溶剂化、截取的簇或表面尺寸不足或冻结过多、周期性计算有悬键或盒子边缘冲突、分子动力学模拟的拓扑文件异常等等……
√546=23.36664289109

124

帖子

0

威望

1676

eV
积分
1800

Level 5 (御坂)

4#
 楼主 Author| 发表于 Post on 2025-2-14 09:14:20 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-2-13 19:25
说训练模型的策略,除了公认重要的文章,还得把社长博客和本论坛的优质内容的权重提高个几倍吧()

其实 ...

感觉应该把所有报错相关情况喂给它,让它用已经有的解决方法逐个去试。比如说不收敛的情况,根据报错输出内容不断调整策略。感觉还是得样本量足够大。

395

帖子

8

威望

3908

eV
积分
4463

Level 6 (一方通行)

石墨

5#
发表于 Post on 2025-2-17 00:08:31 | 只看该作者 Only view this author
本帖最后由 Graphite 于 2025-2-17 00:13 编辑

前面几位说的是Agent的活,通俗来说,就是让AI连续思考-行动-观察-思考,并且为之做一套程序使用接口,让它像一些初级、中级人员一样循环试错排错。
我粗浅试了一下,感觉意义有,但是得有长期资金支持。就说简单量化投分子-排错-收结果这个事儿。

LLM(大语言模型)的中心还是文本,以及图像、视频、语音等少数模态,对于分子几何、势能面等,并没有办法直接把握。

第一是初始输入的结构是不是还需要人类判断,AI毕竟不会像我们一样”在可视化软件里看了,感觉这个键角大一点会好反应”这样,它直接对接的是结构数据,不能像人类一样靠有机合成经验+图像识别一样一眼秒。对人来说文字描述和图像是一码事,对AI来说是多模态,而且还不是被反复炼过的文生图、文生音乐这样的。

第二是出了错很多时候还是靠经验直觉,和第一点是一样的。如果我们不能靠Gaussian/ORCA输出信息稳定一眼秒是哪里不对,那AI只会更难。

第三是对于规则判断类的还是需要人先总结,比如我洗了一遍社长的泛函和基组选择博文,洗成SOP(摘抄如下),deepseek-r1才做到稳出合理选择结果。
2.5 分子和体系特定性质的计算
2.5.1 使用B3LYP,适用于分子振动频率计算
2.5.2 使用B3LYP,适用于HOMO-LUMO gap计算
2.5.3 使用B3LYP结合标度法,适用于NMR计算
2.5.4 使用wB97M-V >= PW6B95-D3(BJ) >= M06-2X,适用于各种弱相互作用计算
2.5.5 使用M06-2X,适用于卤键计算
2.5.6 使用PBE0或TPSSh,适用于主族元素形成的原子团簇计算、以及Cu、Ag、Au形成的无机团簇计算
2.5.7 使用r2SCAN或TPSS或PBE,适用于过渡金属之间通过d轨道形成的化学键计算
2.5.8 使用TPSSh,适用于主族原子桥联过渡金属情况计算
2.5.9 使用MN15L,适用于计算配合物不同自旋多重度能量差
2.5.10 使用PBE0、TPSSh,适用于电子密度分布计算
2.5.11 使用wB97M-V,适用于偶极矩、多极矩、静电势计算

这其实和if...else也差不多了,区别是deepseek-r1会做权衡判断。就是说进行准确判断的前提是人类已经完全跑通,AI负责看领导脸色落实执行。

换句话说,复杂度略等于建一套完善的SOP体系,把一堆跨考过来、理解能力可以的文科生,训练成合格的计算化学工程师(不要求研究者)。

不过因为恰饭原因这个尝试暂时搁置(毕竟整出来也没我自己+AI少量协助快),哪位有兴趣或者进展请多PM指教。


评分 Rate

参与人数
Participants 2
eV +6 收起 理由
Reason
Weichky + 1
yihanxu + 5

查看全部评分 View all ratings

自在飞花轻似梦,无边丝雨细如愁。

全自动反应动力学(ReaxFF、AIMD、NEP等)后处理工具网页版:http://cc-portal.xyz/reax_tools

601

帖子

1

威望

4779

eV
积分
5400

Level 6 (一方通行)

6#
发表于 Post on 2025-2-17 11:00:08 | 只看该作者 Only view this author

deepseek-R1 能为量化做什么?

看了这个标题的第一反应是:量化公司能为量化做什么?
现代化学以狄拉克的一句“一切化学问题业已解决”为嚆矢。滥觞于经验主义传统的期望正失去它们的借鉴意义。但面对看似不可达的通往天堂之阶梯,我想循伍德沃德“最好的模型是你底物的对映异构体”的信仰好过过早地振翮。
我们怀揣热忱的灵魂天然被赋予对第一性的追求,不屑于单一坐标的约束,钟情于势能面彼端的芬芳。但

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-14 00:05 , Processed in 0.342283 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list