计算化学公社

 找回密码 Forget password
 注册 Register
Views: 361|回复 Reply: 11
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] CP2K在PBE0/TZVP-MOLOPT-GTH等级下的并行效率问题

[复制链接 Copy URL]

91

帖子

0

威望

341

eV
积分
432

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
请问有人测过PBE0/TZVP-MOLOPT-GTH或者PBE0/DZVP-MOLOPT-GTH大概300-500个原子的不同核数并行效率吗?
或者说应该怎么针对他的并行效率做测试呢?有看到一个帖子,不知道可不可以作为参考。
帖子链接:http://bbs.keinsci.com/thread-35518-1-1.html

近期导让我给课题补个AIMD,因为是第一次接触,而且这个耗时也挺高,所以有点担心试错成本过高。目前使用的核数是128核,如果不需要这么多核数的话想跟机时供应商要求换节点。


1382

帖子

6

威望

3051

eV
积分
4553

Level 6 (一方通行)

傻傻的木瓜

2#
发表于 Post on 2026-5-30 10:31:42 | 只看该作者 Only view this author
GFN1-xTB半经验方法和PBE0杂化泛函在计算复杂程度以及程序实现上基本没有多少可比性。做几百原子大体系的杂化泛函计算的话,最重要的倒不是有多少CPU核心、能跑多快,而是有多少内存(或者高速连续读写的硬盘)能存储双电子积分,因为后者决定了能不能算得动的问题。

我不知道为什么一上来就要做几百原子的大体系计算,建议能化简模型就尽量化简,至少几十、一百多原子的小体系没有那么高的试错成本。
√546=23.36664289109

91

帖子

0

威望

341

eV
积分
432

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2026-5-30 10:48:22 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2026-5-30 10:31
GFN1-xTB半经验方法和PBE0杂化泛函在计算复杂程度以及程序实现上基本没有多少可比性。做几百原子大体系的杂 ...

我用gromacs的insert-molecules在真空区自动载入分子的话他一下子就快五百个分子了,也不知道要怎么处理。
如果您有好方法的话还请不吝赐教!omg

91

帖子

0

威望

341

eV
积分
432

Level 3 能力者

4#
 楼主 Author| 发表于 Post on 2026-5-30 10:49:56 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2026-5-30 10:31
GFN1-xTB半经验方法和PBE0杂化泛函在计算复杂程度以及程序实现上基本没有多少可比性。做几百原子大体系的杂 ...

而且我看卢老师的几个例子也是几百个原子欸

1382

帖子

6

威望

3051

eV
积分
4553

Level 6 (一方通行)

傻傻的木瓜

5#
发表于 Post on 2026-5-30 11:08:34 | 只看该作者 Only view this author
本帖最后由 Uus/pMeC6H4-/キ 于 2026-5-30 11:29 编辑
northern_mar 发表于 2026-5-30 10:48
我用gromacs的insert-molecules在真空区自动载入分子的话他一下子就快五百个分子了,也不知道要怎么处理 ...

建模的初始盒子尺寸和密度总是可以自己决定的啊,而且gmx insert-molecules也有-box决定盒子大小或者-nmol决定塞入分子数量的选项。
这里肯定要做出取舍的,特定服务器上跑杂化泛函AIMD模拟总有一个算得动的时间和空间尺度上限,而如果待统计的物理性质或者待观察的反应现象就是要求大盒子、长时间模拟的话那得要么换机子要么换理论方法了。

我不知道你说的卢老师的几个例子是啥,体系特征和计算任务是否类似,但是他应该是介绍了相应的计算机配置和计算耗时的。

编辑:是http://bbs.keinsci.com/thread-59429-1-1.html这帖说的表面催化转化体系吗?
√546=23.36664289109

213

帖子

1

威望

787

eV
积分
1020

Level 4 (黑子)

6#
发表于 Post on 2026-5-30 14:44:38 | 只看该作者 Only view this author
核数当然是多多益善(尤其是几百原子的体系),但是要调整MPI进程和OMP线程的并行搭配,以确保不会OOM(内存不够用);测试重点我认为也应该放到这里。直接拿你自己要算的体系测即可,任务类型就选单点能计算
Failed to load the content due to unknown reasons.

91

帖子

0

威望

341

eV
积分
432

Level 3 能力者

7#
 楼主 Author| 发表于 Post on 2026-5-30 15:13:46 | 只看该作者 Only view this author
Uus/pMeC6H4-/キ 发表于 2026-5-30 11:08
建模的初始盒子尺寸和密度总是可以自己决定的啊,而且gmx insert-molecules也有-box决定盒子大小或者-nmo ...

是的是的,是这个贴子描述的反应
感觉和cp2k班的“例5 水合电子模拟”和“例7 TiO2光催化水析氧反应中间体”两个例子比较像,这两个例子也是200-300个原子

91

帖子

0

威望

341

eV
积分
432

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2026-5-30 15:15:29 | 只看该作者 Only view this author
UW_0728. 发表于 2026-5-30 14:44
核数当然是多多益善(尤其是几百原子的体系),但是要调整MPI进程和OMP线程的并行搭配,以确保不会OOM(内 ...

好的老师,请问这个测试只要算单点能不报爆内存就好了嘛?

6万

帖子

99

威望

6万

eV
积分
127588

管理员

公社社长

9#
发表于 Post on 2026-5-31 02:22:41 | 只看该作者 Only view this author
northern_mar 发表于 2026-5-30 15:15
好的老师,请问这个测试只要算单点能不报爆内存就好了嘛?

你当前应当先说清楚机子有多少内存,别人才能更针对性地回答
杂化泛函的内存消耗是杂化泛函计算的最关键要点之一,这部分知识在北京科音CP2K第一性原理计算培训班(http://www.keinsci.com/KFP)的“能量的计算及相关问题” 里面 “杂化泛函的计算” 讲得超级详细,参加过的话记得认真复习。没参加过的话下文也有简要讨论
CP2K做杂化泛函计算的关键要点和简单例子
http://sobereva.com/690http://bbs.keinsci.com/thread-41087-1-1.html


AIMD每一步的内存消耗量和单点相同,耗时也比单点贵不了太多,所以用单点测试足够说明问题
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

91

帖子

0

威望

341

eV
积分
432

Level 3 能力者

10#
 楼主 Author| 发表于 Post on 2026-5-31 10:37:13 | 只看该作者 Only view this author
本帖最后由 northern_mar 于 2026-5-31 10:52 编辑
sobereva 发表于 2026-5-31 02:22
你当前应当先说清楚机子有多少内存,别人才能更针对性地回答
杂化泛函的内存消耗是杂化泛函计算的最关键 ...

好的!机器节点配置如下:单节点256核,AMD EPYC 9755@2.7GHz,768G内存
我刚刚重新复习了一下并学习了博文,发现这样一段话:
“MAX_MEMORY与MPI并行进程数的乘积必须小于当前机子空余物理内存量,显然应当尽量给大以尽可能减少on-the-fly方式算的ERI量,但也不要太顶着头分配,因为进入HF交换项计算模块之前CP2K还会占一定量的内存,故要有适当余量。在SCF第一轮不断往内存里写入ERI、内存占用量不断增大的过程中,若空余内存已用完时CP2K还在继续往里存ERI,CP2K就会马上崩溃,甚至还可能导致计算机暂时失去响应。所以MAX_MEMORY应当设得恰到好处。”
这是不是意味着我的MAX_MEMORY不能用默认的3000

编辑:确实发生了内存溢出,请问“MAX_MEMORY根据实际并行核数和空余物理内存量设置“这个该怎么去设置比较好呢?

6万

帖子

99

威望

6万

eV
积分
127588

管理员

公社社长

11#
发表于 Post on 2026-6-1 05:50:39 | 只看该作者 Only view this author
northern_mar 发表于 2026-5-31 10:37
好的!机器节点配置如下:单节点256核,AMD EPYC 9755@2.7GHz,768G内存
我刚刚重新复习了一下并学习了 ...

就是满足“MAX_MEMORY与MPI并行进程数的乘积必须小于当前机子空余物理内存量” 要求就完了
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

91

帖子

0

威望

341

eV
积分
432

Level 3 能力者

12#
 楼主 Author| 发表于 Post on 2026-6-1 09:22:05 | 只看该作者 Only view this author
sobereva 发表于 2026-6-1 05:50
就是满足“MAX_MEMORY与MPI并行进程数的乘积必须小于当前机子空余物理内存量” 要求就完了

好嘞 谢谢卢老师!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-6-22 11:53 , Processed in 0.222870 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list