计算化学公社

标题: deepseek-R1 能为量化做什么? [打印本页]

作者
Author:
z1065480896    时间: 2025-2-13 16:47
标题: deepseek-R1 能为量化做什么?
   如今DeepSeek R1 推理模型出来,不知道大家认为量化这块训练这模型有何策略?

作者
Author:
wzkchem5    时间: 2025-2-13 17:03
用DeepSeek自动投计算、监测计算进程、分析报错信息并且重新投计算,我觉得会是一个值得做的方向
作者
Author:
Uus/pMeC6H4-/キ    时间: 2025-2-13 19:25
说训练模型的策略,除了公认重要的文章,还得把社长博客和本论坛的优质内容的权重提高个几倍吧()

其实有点好奇,能不能先通过训练AI识别构建模型结构,在提交计算之前就解决各种简单问题,比如有机小分子没加氢、几何构型明显偏离常识、与溶剂相互作用显著的溶质没做显式溶剂化、截取的簇或表面尺寸不足或冻结过多、周期性计算有悬键或盒子边缘冲突、分子动力学模拟的拓扑文件异常等等……
作者
Author:
z1065480896    时间: 2025-2-14 09:14
Uus/pMeC6H4-/キ 发表于 2025-2-13 19:25
说训练模型的策略,除了公认重要的文章,还得把社长博客和本论坛的优质内容的权重提高个几倍吧()

其实 ...

感觉应该把所有报错相关情况喂给它,让它用已经有的解决方法逐个去试。比如说不收敛的情况,根据报错输出内容不断调整策略。感觉还是得样本量足够大。
作者
Author:
Graphite    时间: 2025-2-17 00:08
本帖最后由 Graphite 于 2025-2-17 00:13 编辑

前面几位说的是Agent的活,通俗来说,就是让AI连续思考-行动-观察-思考,并且为之做一套程序使用接口,让它像一些初级、中级人员一样循环试错排错。
我粗浅试了一下,感觉意义有,但是得有长期资金支持。就说简单量化投分子-排错-收结果这个事儿。

LLM(大语言模型)的中心还是文本,以及图像、视频、语音等少数模态,对于分子几何、势能面等,并没有办法直接把握。

第一是初始输入的结构是不是还需要人类判断,AI毕竟不会像我们一样”在可视化软件里看了,感觉这个键角大一点会好反应”这样,它直接对接的是结构数据,不能像人类一样靠有机合成经验+图像识别一样一眼秒。对人来说文字描述和图像是一码事,对AI来说是多模态,而且还不是被反复炼过的文生图、文生音乐这样的。

第二是出了错很多时候还是靠经验直觉,和第一点是一样的。如果我们不能靠Gaussian/ORCA输出信息稳定一眼秒是哪里不对,那AI只会更难。

第三是对于规则判断类的还是需要人先总结,比如我洗了一遍社长的泛函和基组选择博文,洗成SOP(摘抄如下),deepseek-r1才做到稳出合理选择结果。
2.5 分子和体系特定性质的计算
2.5.1 使用B3LYP,适用于分子振动频率计算
2.5.2 使用B3LYP,适用于HOMO-LUMO gap计算
2.5.3 使用B3LYP结合标度法,适用于NMR计算
2.5.4 使用wB97M-V >= PW6B95-D3(BJ) >= M06-2X,适用于各种弱相互作用计算
2.5.5 使用M06-2X,适用于卤键计算
2.5.6 使用PBE0或TPSSh,适用于主族元素形成的原子团簇计算、以及Cu、Ag、Au形成的无机团簇计算
2.5.7 使用r2SCAN或TPSS或PBE,适用于过渡金属之间通过d轨道形成的化学键计算
2.5.8 使用TPSSh,适用于主族原子桥联过渡金属情况计算
2.5.9 使用MN15L,适用于计算配合物不同自旋多重度能量差
2.5.10 使用PBE0、TPSSh,适用于电子密度分布计算
2.5.11 使用wB97M-V,适用于偶极矩、多极矩、静电势计算

这其实和if...else也差不多了,区别是deepseek-r1会做权衡判断。就是说进行准确判断的前提是人类已经完全跑通,AI负责看领导脸色落实执行。

换句话说,复杂度略等于建一套完善的SOP体系,把一堆跨考过来、理解能力可以的文科生,训练成合格的计算化学工程师(不要求研究者)。

不过因为恰饭原因这个尝试暂时搁置(毕竟整出来也没我自己+AI少量协助快),哪位有兴趣或者进展请多PM指教。



作者
Author:
北大-陶豫    时间: 2025-2-17 11:00

deepseek-R1 能为量化做什么?

看了这个标题的第一反应是:量化公司能为量化做什么?





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3