计算化学公社
标题:
如何用AIMD原子轨迹机器学习拟合势参数跑经典MD
[打印本页]
作者Author:
nusiew
时间:
2023-12-5 17:20
标题:
如何用AIMD原子轨迹机器学习拟合势参数跑经典MD
本帖最后由 nusiew 于 2023-12-5 17:22 编辑
1. 想要利用cp2k输出的AIMD原子轨迹,进行机器学习拟合势参数,跑大规模体系的经典MD,体系暂定是高温合金熔体和熔盐体系。
2. 初步调研发现DeePMD-kit可以实现,目前有一些cp2k从头算、lammps MD和python编程基础,请问DeePMD-kit这个是否好入门?学期周期是否长?对训练的算力要求是否高?
3. 或者有哪些其他更容易实现的途径,谢过各位大佬了
作者Author:
yxzinc
时间:
2023-12-6 09:44
这个是最成熟的方案,cp2k+DP+LAMMPS这一套正刊子刊都发了几篇了
作者Author:
Aletyx
时间:
2023-12-6 10:02
DeePMD-kit非常好入门,跟着教程几分钟就能跑起来
作者Author:
Weldingspock
时间:
2023-12-6 10:23
DP学习资源多,也比较好上手。但是如果你跑大规模体系(大于5w原子)的话,DP的速度太慢,需要许多卡并行才行。如果GPU资源不够可以考虑换GPUMD+NEP的组合
作者Author:
wolfli369
时间:
2023-12-6 10:53
求分享一个样本
作者Author:
Jerry_Fan
时间:
2025-4-13 20:25
本帖最后由 Jerry_Fan 于 2025-4-13 20:26 编辑
你好,请问你后续做的怎么样了?我现在在纠结要不要进行下去。我只有300左右原子,选定了7501帧cp2k的AIMD数据作为初始数据集,之后开始用dpgen进行迭代。但是我发现,我的dp训练过程中,训练1000步需要超过10分钟,即使按照文献中最少训练的50W步也需要80多个小时。这还是在双路128核心超算上跑的(只有CPU)。此外同批次训练4个模型,迭代至少5轮,这个开销还是特别大,同时时间也很久。这还没有算上dpgen的探索和标记中的计算过程,这个过程光是想想就觉得花费不起,还需要考虑其中的bug,以及可能计算错的数据,包括不理想的结果。比如我之前在公社里面还贴出了cp2k计算出的可能存在的问题(或许不是问题),Hieshfeld电荷问题在google cp2k group里面开发者回复可能是cp2k本身潜在的问题。当然还有态密度等等问题。因此,我想问下你的开销大约多少?或者这个时间是否能够接受?或者这个训练的是不是合理的?(我在dpgen的社区里面也提出了这个问题
https://github.com/deepmodeling/dpgen/discussions/1740
)
最近,因为在思考反应力场适用性的问题,想着对比一下反应力场计算和cp2k计算的能量,但是cp2k得结果在-3300hartree左右,这和lammps用计算的-30000多kcal/mol完全没法比较(我知道确实不应该比较绝对值/以及可能的基组赝势选取问题/用的DZVP即使可能精度不够),但是这差距甚大,我有些不明白文献中DFT和reaxff能量结果对比是怎么获得的。反应力场现在用的确实太杂了,很多人甚至不明白就用,我读了能找到的文献,用反应力场做的文献我完全找不到对应的反应力场文件,都是各种组合而来,这显然是不合理的。因此,我也在验证对比已有的一些反应场文件能否适用我的体系。
作者Author:
biogon
时间:
2025-7-1 15:30
Jerry_Fan 发表于 2025-4-13 20:25
你好,请问你后续做的怎么样了?我现在在纠结要不要进行下去。我只有300左右原子,选定了7501帧cp2k的AIMD ...
资源不够就换nep,而且训练mlip根本不需要那么多结构
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3