deepseek-R1 能为量化做什么？

z1065480896 · 发表于 Post on 2025-2-13 16:47:42

如今DeepSeek R1 推理模型出来，不知道大家认为量化这块训练这模型有何策略？

wzkchem5 · 发表于 Post on 2025-2-13 17:03:29

用DeepSeek自动投计算、监测计算进程、分析报错信息并且重新投计算，我觉得会是一个值得做的方向

Uus/pMeC6H4-/キ · 发表于 Post on 2025-2-13 19:25:17

说训练模型的策略，除了公认重要的文章，还得把社长博客和本论坛的优质内容的权重提高个几倍吧（）

其实有点好奇，能不能先通过训练AI识别构建模型结构，在提交计算之前就解决各种简单问题，比如有机小分子没加氢、几何构型明显偏离常识、与溶剂相互作用显著的溶质没做显式溶剂化、截取的簇或表面尺寸不足或冻结过多、周期性计算有悬键或盒子边缘冲突、分子动力学模拟的拓扑文件异常等等……

z1065480896 · 发表于 Post on 2025-2-14 09:14:20

Uus/pMeC6H4-/キ发表于 2025-2-13 19:25
说训练模型的策略，除了公认重要的文章，还得把社长博客和本论坛的优质内容的权重提高个几倍吧（）

其实 ...

感觉应该把所有报错相关情况喂给它，让它用已经有的解决方法逐个去试。比如说不收敛的情况，根据报错输出内容不断调整策略。感觉还是得样本量足够大。

Graphite · 发表于 Post on 2025-2-17 00:08:31

本帖最后由 Graphite 于 2025-2-17 00:13 编辑

前面几位说的是Agent的活，通俗来说，就是让AI连续思考-行动-观察-思考，并且为之做一套程序使用接口，让它像一些初级、中级人员一样循环试错排错。
我粗浅试了一下，感觉意义有，但是得有长期资金支持。就说简单量化投分子-排错-收结果这个事儿。

LLM（大语言模型）的中心还是文本，以及图像、视频、语音等少数模态，对于分子几何、势能面等，并没有办法直接把握。

第一是初始输入的结构是不是还需要人类判断，AI毕竟不会像我们一样”在可视化软件里看了，感觉这个键角大一点会好反应”这样，它直接对接的是结构数据，不能像人类一样靠有机合成经验+图像识别一样一眼秒。对人来说文字描述和图像是一码事，对AI来说是多模态，而且还不是被反复炼过的文生图、文生音乐这样的。

第二是出了错很多时候还是靠经验直觉，和第一点是一样的。如果我们不能靠Gaussian/ORCA输出信息稳定一眼秒是哪里不对，那AI只会更难。

第三是对于规则判断类的还是需要人先总结，比如我洗了一遍社长的泛函和基组选择博文，洗成SOP（摘抄如下），deepseek-r1才做到稳出合理选择结果。

2.5 分子和体系特定性质的计算
2.5.1 使用B3LYP，适用于分子振动频率计算
2.5.2 使用B3LYP，适用于HOMO-LUMO gap计算
2.5.3 使用B3LYP结合标度法，适用于NMR计算
2.5.4 使用wB97M-V >= PW6B95-D3(BJ) >= M06-2X，适用于各种弱相互作用计算
2.5.5 使用M06-2X，适用于卤键计算
2.5.6 使用PBE0或TPSSh，适用于主族元素形成的原子团簇计算、以及Cu、Ag、Au形成的无机团簇计算
2.5.7 使用r2SCAN或TPSS或PBE，适用于过渡金属之间通过d轨道形成的化学键计算
2.5.8 使用TPSSh，适用于主族原子桥联过渡金属情况计算
2.5.9 使用MN15L，适用于计算配合物不同自旋多重度能量差
2.5.10 使用PBE0、TPSSh，适用于电子密度分布计算
2.5.11 使用wB97M-V，适用于偶极矩、多极矩、静电势计算

这其实和if...else也差不多了，区别是deepseek-r1会做权衡判断。就是说进行准确判断的前提是人类已经完全跑通，AI负责看领导脸色落实执行。

换句话说，复杂度略等于建一套完善的SOP体系，把一堆跨考过来、理解能力可以的文科生，训练成合格的计算化学工程师（不要求研究者）。

不过因为恰饭原因这个尝试暂时搁置（毕竟整出来也没我自己+AI少量协助快），哪位有兴趣或者进展请多PM指教。

北大-陶豫 · 发表于 Post on 2025-2-17 11:00:08

deepseek-R1 能为量化做什么？

看了这个标题的第一反应是：量化公司能为量化做什么？

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register

[灌水] deepseek-R1 能为量化做什么？

评分 Rate

浏览过的版块