计算化学公社

标题: 超算上用CP2K做过渡态搜索内存溢出错误 [打印本页]

作者
Author:
大耳朵涂涂    时间: 2024-5-3 17:02
标题: 超算上用CP2K做过渡态搜索内存溢出错误
本帖最后由 大耳朵涂涂 于 2024-5-3 17:02 编辑

各位大佬好,最近在使用超算用CI-NEB做过渡态搜索时,任务交上去之后很快就报错了。
查了十个点,每个点分配三个进程(NPROC_REP 3),计算使用60个核心,MP_NUM_THREADS=2,out信息里显示可用的内存在197G左右。
报错信息:
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 21 with PID 0 on node gknew0535 exited on signal 9 (Killed).

同样的体系结构,之前用64个核心在这个超算上用 cp2k.popt版 跑结构优化的时候,可以正常计算,out信息里每个进程使用的内存也就是1400MiB左右,总内存使用量也就是1.4*64=89.6G左右,离总内存197G还很远。
所以我一开始觉得内存不会有问题。但在使用的时候,先用popt跑(NPROC_REP 6),报上述一样的疑似内存溢出错误;然后用psmp,先后设置MP_NUM_THREADS=6、3、2、1(NPROC_REP 1、2、3、6),也是报同样的错误。
所以想请教一下大家:
1。这个错误是内存溢出引起的吗?
2.如果是内存的问题的话,过渡态搜索的out文件中没找到内存的使用信息,如何估计内存使用的大概情况呢?
3.psmp版本以投任务脚本截图中的方式运行可以吗?使用psmp版本是是否有节省内存的使用方法呢?




作者
Author:
sobereva    时间: 2024-5-3 20:04
看副本的out文件了解更具体原因

对于怀疑内存不够的情况,NEB点数和对应的副本数一点点减少进行测试。另外,CI-NEB没必要用那么大基组和那么高CUTOFF,适当降低可以节约不少内存
作者
Author:
大耳朵涂涂    时间: 2024-5-3 23:41
sobereva 发表于 2024-5-3 20:04
看副本的out文件了解更具体原因

对于怀疑内存不够的情况,NEB点数和对应的副本数一点点减少进行测试。另 ...

谢谢sob老师。副本的out文件里没有与报错有关的信息,我设置的PRINT-LEVEL是MEDIUM,需要提高到HIGH吗。副本的out文件上传到附件了。
我结构优化用的是TZVP,算能量根据您上次的建议用的TZV2P,可以算动。如果再,往下降的话,就降到DZVP了,这个算CI-NEB是够用的吗。截断能这部分,我也做过测试,可能是体系比较大的原因,一直到800和80,能量的变化还有0.005Ha左右的变化;真空层我也做过测试,15A和20A之间能量相差是0.007Ha。保险起见,我就按600和60高一点的标准算了。您看这个是合理的吗?如果可以降的话,可以降到什么范围呢?
对于计算使用内存的情况,对于同样的体系,使用相同的设置,无论是结构优化还是CI-NEB,单个MPI进程使用的内存资源应该是相差不多的,但是为什么用起来感觉相差这么大吗?

作者
Author:
sobereva    时间: 2024-5-3 23:50
大耳朵涂涂 发表于 2024-5-3 23:41
谢谢sob老师。副本的out文件里没有与报错有关的信息,我设置的PRINT-LEVEL是MEDIUM,需要提高到HIGH吗。 ...

CI-NEB用的级别/设置和常规几何优化档次一样
CI-NEB同时跑很多副本,MPI进程数相同的情况下,消耗的内存量远远多于做几何优化
CUTOFF  400够了。原子数很多的时候,收敛性测试不是对总能量而言的,而是对平均每原子而言的。

作者
Author:
1764360701    时间: 2024-5-6 10:16
你好,看了你的.inp文件,看到了一些相关磁性设置的参数,请问你磁性数值的设置是依据啥来设置的,谢谢你
作者
Author:
大耳朵涂涂    时间: 2024-5-6 15:14
sobereva 发表于 2024-5-3 23:50
CI-NEB用的级别/设置和常规几何优化档次一样
CI-NEB同时跑很多副本,MPI进程数相同的情况下,消耗的内存 ...

哦哦好的,谢谢sob老师。这几天试了一下,把CUTTOFF降到400就可以正常跑了。
作者
Author:
大耳朵涂涂    时间: 2024-5-6 15:28
1764360701 发表于 2024-5-6 10:16
你好,看了你的.inp文件,看到了一些相关磁性设置的参数,请问你磁性数值的设置是依据啥来设置的,谢谢你

我的体系之前用VASP跑过,VASP给出了各个原子的磁矩信息,然后我就将主要带磁性的原子的VASP的磁性信息作为初猜,用到CP2K里做晶胞优化。算的时候,我给同样的初猜,设置不同的自旋多重度,收敛之后比较能量,取能量最低的作为后续计算的设置。
我后来也仔细看了一下,CP2K最后收敛的具体的原子的磁性信息与VASP的也不太一样,但是大体上材料的磁性还是可以对上的,都算出来是反铁磁性的,CP2K最后能量最小的多重度设置与VASP算出来的MAG结果也可以对上,所以我就按照这个往下算了。
CP2K的这个磁性还是挺麻烦的,我也折腾了好久。初猜的磁矩,初始给的自旋多重度,都有挺大的影响。我也试过打开 RELAX_MULTYPLICITY,但是好像结果并不太理想,不收敛的依然不收敛。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3