计算化学公社

标题: cp2k_AIMD_GFN1-xTB并行效率简单测试(up to 48 cores) [打印本页]

作者
Author:
Washen    时间: 2023-3-1 19:12
标题: cp2k_AIMD_GFN1-xTB并行效率简单测试(up to 48 cores)
本帖最后由 Washen 于 2023-3-1 19:12 编辑

各位老师好,我准备做一个二维周期性体系的AIMD,打算用GFN1-xTB这个级别
测试计算速度发现不是很理想,这才发现xTB并行效率不佳,为此,进行cp2k_AIMD_GFN1-xTB并行效率测试,结果如下
——————
1. 计算细节
测试任务:http://sobereva.com/587 使用sob老师文章中提供的 “spc216_AIMD.inp” 任务 (步数改为仅50步)
硬件环境:XEON 8175M 24C * 2 | 内存1G2 * 16G | 硬盘希捷银河4T
软件环境:CentOS Stream 8 图形化界面 | cp2k2023.1 toolchain编译popt版 | openmpi-4.1.1

2. 数据
命令:time mpirun -np ${i} cp2k.popt spc216_AIMD.inp > spc216_AIMD.out
数据处理:取同文件夹下.ener文件最后一列UsedTime,取第11至50步的耗时平均
相对速度:指同一个输入相对于2核并行时的相对速度,是平均单步耗时的倒数;相对核效:相对速度除于核数,描述了单核相对发挥的效果
1. spc216_AIMD.inp:
(, 下载次数 Times of downloads: 13) (注:此图横坐标应为Number of Cores,仅为标题错误,内容仍然正确)
2. 作为额外的数据,在inp中增加 MULTIPLE_UNIT_CELL  1  1  2 扩胞
计算时间为原先的2.5倍,
(, 下载次数 Times of downloads: 12)
——————
3. 结论
1. cp2k_AIMD使用GFN1-xTB级别进行计算时,尽管速度很快,但并行效率不佳,增加核数几乎不能提高速度
在32核之上,继续增加核数时,(仅对于本输入来说)不能期望加速计算
2. 关注到降速比,即扩胞为原先两倍之后速度的下降倍数,发现从2核开始直到48核,降速倍数从0.25降低至0.30(排除48C)
这是否有可能意味着多核对于大体系来说仍然是有好处的,尚待讨论

4. 备注
1. 内存:在该任务包括扩胞任务计算中,单个cp2k进程均未占用超过1%内存(即约2GB),我认为内存对本次任务影响不大
2. 48核时计算速度下降,我认为可能同当前服务器上运行的其他程序也占用了一个核有关,这导致其中一个进程速度下降了


作者
Author:
sobereva    时间: 2023-3-2 06:09
测试并行效率问题必须体系足够大。对于GFN1-xTB而言,当前体系仍然不够大。PS:CP2K开发者都用GFN1-xTB跑了上亿原子的AIMD模拟 (Parallel Computing 111 (2022) 102920)
当体系规模不够大的时候,核给得过多反倒可能有害无益,这一点在xtb程序里也是一样的
另外,应当对比MPI并行和MPI+OpenMP混合并行,有可能对于后者反倒效率更高

如果要跑的体系本来就小,建议用核少但是单核性能高的机子跑,比如7950X。如果只有核多但单核性能一般的服务器,建议同时跑多个任务,并且按下文说的对任务和核心进行绑定
通过设置CPU内核绑定降低ORCA同时做多任务的耗时
http://sobereva.com/553http://bbs.keinsci.com/thread-17751-1-1.html

作者
Author:
alystone    时间: 2023-6-1 08:36
请问CP2K中基于xtb方法做md能否实现gpu加速。我看原生xtb已经支持了gpu加速,但原生xtb没有pbc,官方推荐算pbc去dftb+,那个程序又没有sob老师写的友好的cp2k输入文件生成程序。所以想用cp2k的xtb跑长时程的pbc的md,要是能得到gpu加速那就太棒了。
作者
Author:
moonlight2690    时间: 2024-1-12 16:02
sobereva 发表于 2023-3-2 06:09
测试并行效率问题必须体系足够大。对于GFN1-xTB而言,当前体系仍然不够大。PS:CP2K开发者都用GFN1-xTB跑了 ...

sob老师,增大水分子个数到几千个,模拟出的水的密度会合理吗?
作者
Author:
akakcolin    时间: 2024-1-12 16:28
一般的体系比如<1000原子的结构 跑半经验方法,最适合在单/双核上跑,毕竟HS矩阵很小的(矩阵维度就几千附近) 核数多了加速比很差很自然的, 用多了都时浪费
作者
Author:
sobereva    时间: 2024-1-18 03:03
moonlight2690 发表于 2024-1-12 16:02
sob老师,增大水分子个数到几千个,模拟出的水的密度会合理吗?

不是水分子数的事,是GFN1-xTB对凝聚相中水之间相互作用描述本身的问题
单纯说模拟密度做MD至少用的水分子数,200多个就足够了
作者
Author:
whutzty    时间: 2024-11-7 00:27
sobereva 发表于 2023-3-2 06:09
测试并行效率问题必须体系足够大。对于GFN1-xTB而言,当前体系仍然不够大。PS:CP2K开发者都用GFN1-xTB跑了 ...

sob老师您好,我是想为基于GFN1-xTB的分子动力学还可以称为aimd么,我之前做aimd都是用vasp跑的,像这种半经验方法跑md虽然可以处理上千原子级别,我在文章中描述的话是aimd还是md呢

作者
Author:
sobereva    时间: 2024-11-8 21:35
whutzty 发表于 2024-11-7 00:27
sob老师您好,我是想为基于GFN1-xTB的分子动力学还可以称为aimd么,我之前做aimd都是用vasp跑的,像这种 ...

可以勉强算进AIMD或者FPMD(first-principle molecular dynamics)
虽然语义没那么严格,但大家都知道是怎么回事

作者
Author:
whutzty    时间: 2024-11-15 02:15
sobereva 发表于 2024-11-8 21:35
可以勉强算进AIMD或者FPMD(first-principle molecular dynamics)
虽然语义没那么严格,但大家都知道是 ...

谢谢老师





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3