CP2K在PBE0/TZVP-MOLOPT-GTH等级下的并行效率问题

northern_mar · 发表于 Post on 2026-5-30 09:47:38

请问有人测过PBE0/TZVP-MOLOPT-GTH或者PBE0/DZVP-MOLOPT-GTH大概300-500个原子的不同核数并行效率吗？
或者说应该怎么针对他的并行效率做测试呢？有看到一个帖子，不知道可不可以作为参考。
帖子链接：http://bbs.keinsci.com/thread-35518-1-1.html

近期导让我给课题补个AIMD，因为是第一次接触，而且这个耗时也挺高，所以有点担心试错成本过高。目前使用的核数是128核，如果不需要这么多核数的话想跟机时供应商要求换节点。

Uus/pMeC6H4-/キ · 发表于 Post on 2026-5-30 10:31:42

GFN1-xTB半经验方法和PBE0杂化泛函在计算复杂程度以及程序实现上基本没有多少可比性。做几百原子大体系的杂化泛函计算的话，最重要的倒不是有多少CPU核心、能跑多快，而是有多少内存（或者高速连续读写的硬盘）能存储双电子积分，因为后者决定了能不能算得动的问题。

我不知道为什么一上来就要做几百原子的大体系计算，建议能化简模型就尽量化简，至少几十、一百多原子的小体系没有那么高的试错成本。

northern_mar · 发表于 Post on 2026-5-30 10:48:22

Uus/pMeC6H4-/キ发表于 2026-5-30 10:31
GFN1-xTB半经验方法和PBE0杂化泛函在计算复杂程度以及程序实现上基本没有多少可比性。做几百原子大体系的杂 ...

我用gromacs的insert-molecules在真空区自动载入分子的话他一下子就快五百个分子了，也不知道要怎么处理。
如果您有好方法的话还请不吝赐教！omg

northern_mar · 发表于 Post on 2026-5-30 10:49:56

Uus/pMeC6H4-/キ发表于 2026-5-30 10:31
GFN1-xTB半经验方法和PBE0杂化泛函在计算复杂程度以及程序实现上基本没有多少可比性。做几百原子大体系的杂 ...

而且我看卢老师的几个例子也是几百个原子欸

Uus/pMeC6H4-/キ · 发表于 Post on 2026-5-30 11:08:34

本帖最后由 Uus/pMeC6H4-/キ于 2026-5-30 11:29 编辑

northern_mar 发表于 2026-5-30 10:48
我用gromacs的insert-molecules在真空区自动载入分子的话他一下子就快五百个分子了，也不知道要怎么处理 ...

建模的初始盒子尺寸和密度总是可以自己决定的啊，而且gmx insert-molecules也有-box决定盒子大小或者-nmol决定塞入分子数量的选项。
这里肯定要做出取舍的，特定服务器上跑杂化泛函AIMD模拟总有一个算得动的时间和空间尺度上限，而如果待统计的物理性质或者待观察的反应现象就是要求大盒子、长时间模拟的话那得要么换机子要么换理论方法了。

我不知道你说的卢老师的几个例子是啥，体系特征和计算任务是否类似，但是他应该是介绍了相应的计算机配置和计算耗时的。

编辑：是http://bbs.keinsci.com/thread-59429-1-1.html这帖说的表面催化转化体系吗？

UW_0728. · 发表于 Post on 2026-5-30 14:44:38

核数当然是多多益善（尤其是几百原子的体系），但是要调整MPI进程和OMP线程的并行搭配，以确保不会OOM（内存不够用）；测试重点我认为也应该放到这里。直接拿你自己要算的体系测即可，任务类型就选单点能计算

northern_mar · 发表于 Post on 2026-5-30 15:13:46

Uus/pMeC6H4-/キ发表于 2026-5-30 11:08
建模的初始盒子尺寸和密度总是可以自己决定的啊，而且gmx insert-molecules也有-box决定盒子大小或者-nmo ...

是的是的，是这个贴子描述的反应
感觉和cp2k班的“例5 水合电子模拟”和“例7 TiO2光催化水析氧反应中间体”两个例子比较像，这两个例子也是200-300个原子

northern_mar · 发表于 Post on 2026-5-30 15:15:29

UW_0728. 发表于 2026-5-30 14:44
核数当然是多多益善（尤其是几百原子的体系），但是要调整MPI进程和OMP线程的并行搭配，以确保不会OOM（内 ...

好的老师，请问这个测试只要算单点能不报爆内存就好了嘛？

sobereva · 发表于 Post on 2026-5-31 02:22:41

northern_mar 发表于 2026-5-30 15:15
好的老师，请问这个测试只要算单点能不报爆内存就好了嘛？

你当前应当先说清楚机子有多少内存，别人才能更针对性地回答
杂化泛函的内存消耗是杂化泛函计算的最关键要点之一，这部分知识在北京科音CP2K第一性原理计算培训班（http://www.keinsci.com/KFP）的“能量的计算及相关问题” 里面 “杂化泛函的计算” 讲得超级详细，参加过的话记得认真复习。没参加过的话下文也有简要讨论
CP2K做杂化泛函计算的关键要点和简单例子
http://sobereva.com/690（http://bbs.keinsci.com/thread-41087-1-1.html）

AIMD每一步的内存消耗量和单点相同，耗时也比单点贵不了太多，所以用单点测试足够说明问题

northern_mar · 发表于 Post on 2026-5-31 10:37:13

本帖最后由 northern_mar 于 2026-5-31 10:52 编辑

sobereva 发表于 2026-5-31 02:22
你当前应当先说清楚机子有多少内存，别人才能更针对性地回答
杂化泛函的内存消耗是杂化泛函计算的最关键 ...

好的！机器节点配置如下：单节点256核，AMD EPYC 9755@2.7GHz，768G内存
我刚刚重新复习了一下并学习了博文，发现这样一段话：
“MAX_MEMORY与MPI并行进程数的乘积必须小于当前机子空余物理内存量，显然应当尽量给大以尽可能减少on-the-fly方式算的ERI量，但也不要太顶着头分配，因为进入HF交换项计算模块之前CP2K还会占一定量的内存，故要有适当余量。在SCF第一轮不断往内存里写入ERI、内存占用量不断增大的过程中，若空余内存已用完时CP2K还在继续往里存ERI，CP2K就会马上崩溃，甚至还可能导致计算机暂时失去响应。所以MAX_MEMORY应当设得恰到好处。”
这是不是意味着我的MAX_MEMORY不能用默认的3000

编辑：确实发生了内存溢出，请问“MAX_MEMORY根据实际并行核数和空余物理内存量设置“这个该怎么去设置比较好呢？

sobereva · 发表于 Post on 2026-6-1 05:50:39

northern_mar 发表于 2026-5-31 10:37
好的！机器节点配置如下：单节点256核，AMD EPYC 9755@2.7GHz，768G内存
我刚刚重新复习了一下并学习了 ...

就是满足“MAX_MEMORY与MPI并行进程数的乘积必须小于当前机子空余物理内存量” 要求就完了

northern_mar · 发表于 Post on 2026-6-1 09:22:05

sobereva 发表于 2026-6-1 05:50
就是满足“MAX_MEMORY与MPI并行进程数的乘积必须小于当前机子空余物理内存量” 要求就完了

好嘞谢谢卢老师！

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register

[CP2K] CP2K在PBE0/TZVP-MOLOPT-GTH等级下的并行效率问题