计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: joeson
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合讨论] 关于DeePMD-Kit支持CP2K的数据格式的一个疑问(已解决)

[复制链接 Copy URL]

266

帖子

0

威望

933

eV
积分
1199

Level 4 (黑子)

16#
发表于 Post on 2025-3-23 23:56:57 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2024-12-17 18:22
借楼问另一个小问题,用于DeePMD-kit训练的原子坐标数据对PBC是怎么考虑的?CP2K虽然输入有定义PBC以及盒 ...

您好,请问您现在知道在使用DeepMD-kit时,构建的数据集是否要对盒子wrap处理吗(使用CP2K跑AIMD)?我看了一些教程,似乎都没有提到要wrap处理,都是使用dpdata包的dpdata.LabeledSystem()直接处理

887

帖子

3

威望

1669

eV
积分
2616

Level 5 (御坂)

傻傻的木瓜

17#
发表于 Post on 2025-3-24 11:47:51 | 只看该作者 Only view this author
ljh123 发表于 2025-3-23 23:56
您好,请问您现在知道在使用DeepMD-kit时,构建的数据集是否要对盒子wrap处理吗(使用CP2K跑AIMD)?我看 ...

https://github.com/deepmodeling/deepmd-kit/discussions/21这条6年前的讨论中,维护者回答说DeePMD-kit的盒子以(0, 0, 0)为原点,程序会尝试一次把原子卷入盒子;但若原子飘太远了则卷入失败会产生警告,所以还是建议准备数据集的时候就把原子恰当卷入盒子。不知道CP2K跑AIMD这么有限的时长内会不会出现这个问题,为了保险期间还是wrap的好。

dpdata那边也有个https://github.com/deepmodeling/dpdata/discussions/581讨论,但指向的文档(无论是当年的还是现在的版本)也没见明说这点。https://github.com/deepmodeling/ ... er/dpdata/system.py里也定义有函数apply_pbc(),调用了前面那帖说的md/pbc.py,但似乎不会自动作用于System或者LabeledSystem……确实有点迷。
√546=23.36664289109

266

帖子

0

威望

933

eV
积分
1199

Level 4 (黑子)

18#
发表于 Post on 2025-3-24 16:35:42 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-3-24 11:47
在https://github.com/deepmodeling/deepmd-kit/discussions/21这条6年前的讨论中,维护者回答说DeePMD-k ...

感谢您!
对于机器学习力场我还有一些疑问。由于是在lammps里进行生产,机器学习力场现在是否是无法用于开壳层体系呢(比如自由基、过渡金属)。此外,体系是否也需要保持电中性呢。

887

帖子

3

威望

1669

eV
积分
2616

Level 5 (御坂)

傻傻的木瓜

19#
发表于 Post on 2025-3-24 17:39:35 | 只看该作者 Only view this author
本帖最后由 Uus/pMeC6H4-/キ 于 2025-3-25 16:45 编辑
ljh123 发表于 2025-3-24 16:35
感谢您!
对于机器学习力场我还有一些疑问。由于是在lammps里进行生产,机器学习力场现在是否是无法用于 ...

单看软件的用户说明的话,DeePMD-kit可以在训练神经网络势时接受原子自旋信息(https://docs.deepmodeling.com/pr ... in-energy-spin.html),LAMMPS也有自旋相关的功能(https://docs.lammps.org/Howto_spins.html)。但要问能不能应用于开壳层体系,那可能取决于研究对象是否需要精确的电子结构/波函数信息才能描述吧,我不清楚了。(编辑:有可能这个自旋不是指电子自旋而是核自旋或者原子的净自旋之类的……反正我是没用过这功能。)

电中性的问题可以到刚被翻出来的老帖http://bbs.keinsci.com/thread-17977-1-1.html看看
√546=23.36664289109

266

帖子

0

威望

933

eV
积分
1199

Level 4 (黑子)

20#
发表于 Post on 2025-3-25 16:11:54 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-3-24 17:39
单看软件的用户说明的话,DeePMD-kit可以在训练神经网络势时接受原子自旋信息(https://docs.deepmodelin ...

还想请教下您,Deepmd-kit需要的训练集是否应该在NVT系综下模拟得到呢。因为似乎dpdata在对CP2K数据转换时,只考虑xyz轨迹文件。似乎转换时只在out文件里考虑一帧的盒子信息。

887

帖子

3

威望

1669

eV
积分
2616

Level 5 (御坂)

傻傻的木瓜

21#
发表于 Post on 2025-3-25 17:15:26 | 只看该作者 Only view this author
ljh123 发表于 2025-3-25 16:11
还想请教下您,Deepmd-kit需要的训练集是否应该在NVT系综下模拟得到呢。因为似乎dpdata在对CP2K数据转换 ...

我不用dpdata不清楚具体如何(建议去github问别人),但既然DeePMD-kit的数据集包括每帧的盒子尺寸信息(看https://docs.deepmodeling.com/pr ... le/data/system.html的Boxes),应该可以自行写程序提取NPT系综MD里变化的盒子尺寸并转换为输入格式。NVT系综的效果不过是让盒子尺寸保持初始不变。
√546=23.36664289109

266

帖子

0

威望

933

eV
积分
1199

Level 4 (黑子)

22#
发表于 Post on 2025-3-30 17:55:50 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-3-25 17:15
我不用dpdata不清楚具体如何(建议去github问别人),但既然DeePMD-kit的数据集包括每帧的盒子尺寸信息( ...

大佬,经过几天的调试,CP2K+deepmd-kit+lammps的流程我总算跑通了。同时dpgen也没问题了。但是在训练模型前我想请教下您。我在CP2K进行AIMD模拟获取初始训练集时是否要加反离子保持体系电中性呢?因为lammps跑经典MD时是需要保持电中性的(而CP2K跑AIMD应该是可以不保持电中性的)。但是我不清楚用AIMD数据训练出来的机器学习力场在lammps跑MD时,是否仍然需要保持电中性呢(以及跑AIMD获取数据集时是否也要保持电中性)

887

帖子

3

威望

1669

eV
积分
2616

Level 5 (御坂)

傻傻的木瓜

23#
发表于 Post on 2025-3-31 10:42:41 | 只看该作者 Only view this author
ljh123 发表于 2025-3-30 17:55
大佬,经过几天的调试,CP2K+deepmd-kit+lammps的流程我总算跑通了。同时dpgen也没问题了。但是在训练模 ...

我研究的周期性体系都不带净电荷。DeePMD-kit只用能量和受力来训练神经网络势、后续LAMMPS用atom_style atomic和pair_style deepmd跑机器学习势分子动力学的时候,并不明显涉及原子电荷(本来原子电荷的定义也不唯一)或体系净电荷的信息。但这都是后话了,毕竟机器学习势能应用的体系多少局限于和训练集相似的体系。

AIMD中周期镜像之间的静电排斥对能量计算乃至动力学行为的影响可能不应忽略(特别是还有外电场之类的时候),这也取决于具体的体系和研究目的,我觉得还是加上保险,也省得受到质疑。
√546=23.36664289109

266

帖子

0

威望

933

eV
积分
1199

Level 4 (黑子)

24#
发表于 Post on 2025-3-31 15:39:02 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2025-3-31 10:42
我研究的周期性体系都不带净电荷。DeePMD-kit只用能量和受力来训练神经网络势、后续LAMMPS用atom_style a ...

感谢,我决定训练时就保持电中性好了

62

帖子

0

威望

353

eV
积分
415

Level 3 能力者

25#
发表于 Post on 2025-6-12 14:16:24 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2024-11-19 14:01
今天试了一下,原来设&FORCE_EVAL/&PRINT/&FORCES输出的受力信息并非默认在我以为的另一个.log文件,而是 ...

您好,请问一下可以分享一个转换数据的脚本么,我用24.3版本的cp2k跑的结果,生成deeomd格式的时候总是会报错,用7.1版本的cp2k就可以成功生成出来

51

帖子

0

威望

217

eV
积分
268

Level 3 能力者

26#
发表于 Post on 2025-6-12 14:49:18 | 只看该作者 Only view this author
huyongxin 发表于 2025-6-12 14:16
您好,请问一下可以分享一个转换数据的脚本么,我用24.3版本的cp2k跑的结果,生成deeomd格式的时候总是会 ...

邮箱发我,我可以给你一个我们课题组在用的脚本
是了,它已证明是可以信赖的,而且我从来也没有为选择了这条道路而后悔过。
——爱因斯坦

1

帖子

0

威望

47

eV
积分
48

Level 2 能力者

27#
发表于 Post on 2025-6-22 04:29:36 | 只看该作者 Only view this author
xiaowei2022 发表于 2025-6-12 14:49
邮箱发我,我可以给你一个我们课题组在用的脚本

你好,邮箱是 liuzhaochun@gmail.com  十分感谢,我也需要处理CP2K aimd 的数据集的脚本。

51

帖子

0

威望

217

eV
积分
268

Level 3 能力者

28#
发表于 Post on 2025-6-25 14:51:03 | 只看该作者 Only view this author
liuchun0413 发表于 2025-6-22 04:29
你好,邮箱是   十分感谢,我也需要处理CP2K aimd 的数据集的脚本。

已发
是了,它已证明是可以信赖的,而且我从来也没有为选择了这条道路而后悔过。
——爱因斯坦

266

帖子

0

威望

933

eV
积分
1199

Level 4 (黑子)

29#
发表于 Post on 2025-6-25 15:01:13 | 只看该作者 Only view this author
xiaowei2022 发表于 2025-6-12 14:49
邮箱发我,我可以给你一个我们课题组在用的脚本

您好,请问可以发我一份吗,我想用来学习下。邮箱是1292211370@qq.com。十分感谢!

51

帖子

0

威望

217

eV
积分
268

Level 3 能力者

30#
发表于 Post on 2025-7-2 15:16:12 | 只看该作者 Only view this author
ljh123 发表于 2025-6-25 15:01
您好,请问可以发我一份吗,我想用来学习下。邮箱是。十分感谢!

已发
是了,它已证明是可以信赖的,而且我从来也没有为选择了这条道路而后悔过。
——爱因斯坦

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-13 22:05 , Processed in 0.288804 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list