计算化学公社

 找回密码 Forget password
 注册 Register
Views: 846|回复 Reply: 6
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] 超算上用CP2K做过渡态搜索内存溢出错误

[复制链接 Copy URL]

19

帖子

0

威望

141

eV
积分
160

Level 3 能力者

本帖最后由 大耳朵涂涂 于 2024-5-3 17:02 编辑

各位大佬好,最近在使用超算用CI-NEB做过渡态搜索时,任务交上去之后很快就报错了。
查了十个点,每个点分配三个进程(NPROC_REP 3),计算使用60个核心,MP_NUM_THREADS=2,out信息里显示可用的内存在197G左右。
报错信息:
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 21 with PID 0 on node gknew0535 exited on signal 9 (Killed).

同样的体系结构,之前用64个核心在这个超算上用 cp2k.popt版 跑结构优化的时候,可以正常计算,out信息里每个进程使用的内存也就是1400MiB左右,总内存使用量也就是1.4*64=89.6G左右,离总内存197G还很远。
所以我一开始觉得内存不会有问题。但在使用的时候,先用popt跑(NPROC_REP 6),报上述一样的疑似内存溢出错误;然后用psmp,先后设置MP_NUM_THREADS=6、3、2、1(NPROC_REP 1、2、3、6),也是报同样的错误。
所以想请教一下大家:
1。这个错误是内存溢出引起的吗?
2.如果是内存的问题的话,过渡态搜索的out文件中没找到内存的使用信息,如何估计内存使用的大概情况呢?
3.psmp版本以投任务脚本截图中的方式运行可以吗?使用psmp版本是是否有节省内存的使用方法呢?



202405031654358501..png (85.64 KB, 下载次数 Times of downloads: 15)

投任务脚本

投任务脚本

202405031651578607..png (111.58 KB, 下载次数 Times of downloads: 11)

报错信息

报错信息

TOS.inp

24.05 KB, 下载次数 Times of downloads: 18

输入文件

Te1-C2H6.xyz

17.42 KB, 下载次数 Times of downloads: 1

初态结构

Te1-OH-C2H5-O-V2.xyz

17.42 KB, 下载次数 Times of downloads: 1

末态结构

output.5532349

163.75 KB, 下载次数 Times of downloads: 2

计算输出

5万

帖子

99

威望

5万

eV
积分
112359

管理员

公社社长

2#
发表于 Post on 2024-5-3 20:04:12 | 只看该作者 Only view this author
看副本的out文件了解更具体原因

对于怀疑内存不够的情况,NEB点数和对应的副本数一点点减少进行测试。另外,CI-NEB没必要用那么大基组和那么高CUTOFF,适当降低可以节约不少内存
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

19

帖子

0

威望

141

eV
积分
160

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2024-5-3 23:41:09 | 只看该作者 Only view this author
sobereva 发表于 2024-5-3 20:04
看副本的out文件了解更具体原因

对于怀疑内存不够的情况,NEB点数和对应的副本数一点点减少进行测试。另 ...

谢谢sob老师。副本的out文件里没有与报错有关的信息,我设置的PRINT-LEVEL是MEDIUM,需要提高到HIGH吗。副本的out文件上传到附件了。
我结构优化用的是TZVP,算能量根据您上次的建议用的TZV2P,可以算动。如果再,往下降的话,就降到DZVP了,这个算CI-NEB是够用的吗。截断能这部分,我也做过测试,可能是体系比较大的原因,一直到800和80,能量的变化还有0.005Ha左右的变化;真空层我也做过测试,15A和20A之间能量相差是0.007Ha。保险起见,我就按600和60高一点的标准算了。您看这个是合理的吗?如果可以降的话,可以降到什么范围呢?
对于计算使用内存的情况,对于同样的体系,使用相同的设置,无论是结构优化还是CI-NEB,单个MPI进程使用的内存资源应该是相差不多的,但是为什么用起来感觉相差这么大吗?

TOS-BAND1.out

24.31 KB, 下载次数 Times of downloads: 1

5万

帖子

99

威望

5万

eV
积分
112359

管理员

公社社长

4#
发表于 Post on 2024-5-3 23:50:21 | 只看该作者 Only view this author
大耳朵涂涂 发表于 2024-5-3 23:41
谢谢sob老师。副本的out文件里没有与报错有关的信息,我设置的PRINT-LEVEL是MEDIUM,需要提高到HIGH吗。 ...

CI-NEB用的级别/设置和常规几何优化档次一样
CI-NEB同时跑很多副本,MPI进程数相同的情况下,消耗的内存量远远多于做几何优化
CUTOFF  400够了。原子数很多的时候,收敛性测试不是对总能量而言的,而是对平均每原子而言的。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

57

帖子

0

威望

329

eV
积分
386

Level 3 能力者

5#
发表于 Post on 2024-5-6 10:16:43 | 只看该作者 Only view this author
你好,看了你的.inp文件,看到了一些相关磁性设置的参数,请问你磁性数值的设置是依据啥来设置的,谢谢你

19

帖子

0

威望

141

eV
积分
160

Level 3 能力者

6#
 楼主 Author| 发表于 Post on 2024-5-6 15:14:23 | 只看该作者 Only view this author
sobereva 发表于 2024-5-3 23:50
CI-NEB用的级别/设置和常规几何优化档次一样
CI-NEB同时跑很多副本,MPI进程数相同的情况下,消耗的内存 ...

哦哦好的,谢谢sob老师。这几天试了一下,把CUTTOFF降到400就可以正常跑了。

19

帖子

0

威望

141

eV
积分
160

Level 3 能力者

7#
 楼主 Author| 发表于 Post on 2024-5-6 15:28:50 | 只看该作者 Only view this author
1764360701 发表于 2024-5-6 10:16
你好,看了你的.inp文件,看到了一些相关磁性设置的参数,请问你磁性数值的设置是依据啥来设置的,谢谢你

我的体系之前用VASP跑过,VASP给出了各个原子的磁矩信息,然后我就将主要带磁性的原子的VASP的磁性信息作为初猜,用到CP2K里做晶胞优化。算的时候,我给同样的初猜,设置不同的自旋多重度,收敛之后比较能量,取能量最低的作为后续计算的设置。
我后来也仔细看了一下,CP2K最后收敛的具体的原子的磁性信息与VASP的也不太一样,但是大体上材料的磁性还是可以对上的,都算出来是反铁磁性的,CP2K最后能量最小的多重度设置与VASP算出来的MAG结果也可以对上,所以我就按照这个往下算了。
CP2K的这个磁性还是挺麻烦的,我也折腾了好久。初猜的磁矩,初始给的自旋多重度,都有挺大的影响。我也试过打开 RELAX_MULTYPLICITY,但是好像结果并不太理想,不收敛的依然不收敛。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 19:01 , Processed in 0.185288 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list