计算化学公社

标题: cp2k_AIMD_GFN1-xTB并行效率简单测试（up to 48 cores） [打印本页]

作者
Author: Washen 时间: 2023-3-1 19:12
标题: cp2k_AIMD_GFN1-xTB并行效率简单测试（up to 48 cores）
本帖最后由 Washen 于 2023-3-1 19:12 编辑

各位老师好，我准备做一个二维周期性体系的AIMD，打算用GFN1-xTB这个级别
测试计算速度发现不是很理想，这才发现xTB并行效率不佳，为此，进行cp2k_AIMD_GFN1-xTB并行效率测试，结果如下
——————
1. 计算细节
测试任务：http://sobereva.com/587 使用sob老师文章中提供的 “spc216_AIMD.inp” 任务（步数改为仅50步）
硬件环境：XEON 8175M 24C * 2 | 内存1G2 * 16G | 硬盘希捷银河4T
软件环境：CentOS Stream 8 图形化界面 | cp2k2023.1 toolchain编译popt版 | openmpi-4.1.1

2. 数据
命令：time mpirun -np ${i} cp2k.popt spc216_AIMD.inp > spc216_AIMD.out
数据处理：取同文件夹下.ener文件最后一列UsedTime，取第11至50步的耗时平均
相对速度：指同一个输入相对于2核并行时的相对速度，是平均单步耗时的倒数；相对核效：相对速度除于核数，描述了单核相对发挥的效果
1. spc216_AIMD.inp：
(, 下载次数 Times of downloads: 62) （注：此图横坐标应为Number of Cores，仅为标题错误，内容仍然正确）
2. 作为额外的数据，在inp中增加 MULTIPLE_UNIT_CELL 1 1 2 扩胞
计算时间为原先的2.5倍，
(, 下载次数 Times of downloads: 63)
——————
3. 结论
1. cp2k_AIMD使用GFN1-xTB级别进行计算时，尽管速度很快，但并行效率不佳，增加核数几乎不能提高速度
在32核之上，继续增加核数时，（仅对于本输入来说）不能期望加速计算
2. 关注到降速比，即扩胞为原先两倍之后速度的下降倍数，发现从2核开始直到48核，降速倍数从0.25降低至0.30（排除48C）
这是否有可能意味着多核对于大体系来说仍然是有好处的，尚待讨论

4. 备注
1. 内存：在该任务包括扩胞任务计算中，单个cp2k进程均未占用超过1%内存（即约2GB），我认为内存对本次任务影响不大
2. 48核时计算速度下降，我认为可能同当前服务器上运行的其他程序也占用了一个核有关，这导致其中一个进程速度下降了

作者
Author: sobereva 时间: 2023-3-2 06:09
测试并行效率问题必须体系足够大。对于GFN1-xTB而言，当前体系仍然不够大。PS：CP2K开发者都用GFN1-xTB跑了上亿原子的AIMD模拟（Parallel Computing 111 (2022) 102920）
当体系规模不够大的时候，核给得过多反倒可能有害无益，这一点在xtb程序里也是一样的
另外，应当对比MPI并行和MPI+OpenMP混合并行，有可能对于后者反倒效率更高

如果要跑的体系本来就小，建议用核少但是单核性能高的机子跑，比如7950X。如果只有核多但单核性能一般的服务器，建议同时跑多个任务，并且按下文说的对任务和核心进行绑定
通过设置CPU内核绑定降低ORCA同时做多任务的耗时
http://sobereva.com/553（http://bbs.keinsci.com/thread-17751-1-1.html）

作者
Author: alystone 时间: 2023-6-1 08:36
请问CP2K中基于xtb方法做md能否实现gpu加速。我看原生xtb已经支持了gpu加速，但原生xtb没有pbc，官方推荐算pbc去dftb+，那个程序又没有sob老师写的友好的cp2k输入文件生成程序。所以想用cp2k的xtb跑长时程的pbc的md，要是能得到gpu加速那就太棒了。

作者
Author: moonlight2690 时间: 2024-1-12 16:02

sobereva 发表于 2023-3-2 06:09
测试并行效率问题必须体系足够大。对于GFN1-xTB而言，当前体系仍然不够大。PS：CP2K开发者都用GFN1-xTB跑了 ...

sob老师，增大水分子个数到几千个，模拟出的水的密度会合理吗？

作者
Author: akakcolin 时间: 2024-1-12 16:28
一般的体系比如<1000原子的结构跑半经验方法，最适合在单/双核上跑，毕竟HS矩阵很小的（矩阵维度就几千附近）核数多了加速比很差很自然的，用多了都时浪费

作者
Author: sobereva 时间: 2024-1-18 03:03

moonlight2690 发表于 2024-1-12 16:02
sob老师，增大水分子个数到几千个，模拟出的水的密度会合理吗？

不是水分子数的事，是GFN1-xTB对凝聚相中水之间相互作用描述本身的问题
单纯说模拟密度做MD至少用的水分子数，200多个就足够了

作者
Author: whutzty 时间: 2024-11-7 00:27

sobereva 发表于 2023-3-2 06:09
测试并行效率问题必须体系足够大。对于GFN1-xTB而言，当前体系仍然不够大。PS：CP2K开发者都用GFN1-xTB跑了 ...

sob老师您好，我是想为基于GFN1-xTB的分子动力学还可以称为aimd么，我之前做aimd都是用vasp跑的，像这种半经验方法跑md虽然可以处理上千原子级别，我在文章中描述的话是aimd还是md呢

作者
Author: sobereva 时间: 2024-11-8 21:35

whutzty 发表于 2024-11-7 00:27
sob老师您好，我是想为基于GFN1-xTB的分子动力学还可以称为aimd么，我之前做aimd都是用vasp跑的，像这种 ...

可以勉强算进AIMD或者FPMD（first-principle molecular dynamics）
虽然语义没那么严格，但大家都知道是怎么回事

作者
Author: whutzty 时间: 2024-11-15 02:15

sobereva 发表于 2024-11-8 21:35
可以勉强算进AIMD或者FPMD（first-principle molecular dynamics）
虽然语义没那么严格，但大家都知道是 ...

谢谢老师

欢迎光临计算化学公社 (http://bbs.keinsci.com/)