计算化学公社

标题: 求助:cp2k并行计算时报错会报96次 [打印本页]

作者
Author:
周志博    时间: 2024-5-21 20:52
标题: 求助:cp2k并行计算时报错会报96次
本帖最后由 周志博 于 2024-5-21 20:55 编辑

在使用96核电脑进行cp2k的popt版本进行96核并行计算时候,一旦SCF没有收敛,就会产生报错,在正常的一次报错提示后,接下来还会产生96次报错。前阶段还烧坏了主板(我认为是短时间报错太多次,瞬时电流太大,导致主板烧坏)。以下是我运行mpirun -np 48 cp2k.popt test.inp |tee test.out命令时候出现的报错情况,正常报错之后的ABORT又出现了48次

谢各位大佬指点!







作者
Author:
r1ck    时间: 2024-5-21 21:11
把inp里IGNORE_CONVERGENCE_FAILUR前面的注释去掉
作者
Author:
白皛白    时间: 2024-5-21 21:36
类似重复报错的问题之前使用VASP的时候遇到过,是通过将mpirun替换成mpiexec.hydra解决的,试试mpiexec.hydra -np 48 cp2k.popt test.inp |tee test.out重复报错48次的问题可能会得到解决,但是本身inp中的问题还请参照楼上这位老师的建议。
作者
Author:
zjxitcc    时间: 2024-5-21 22:27
r1ck 发表于 2024-5-21 21:11
把inp里IGNORE_CONVERGENCE_FAILUR前面的注释去掉

第一个结构这么用勉强可以,要是所有结构都这么用,岂不相当于高斯的IOp(5/13=1)
作者
Author:
sobereva    时间: 2024-5-21 23:46
“短时间报错太多次,瞬时电流太大,导致主板烧坏”想象力真丰富

从CP2K 2024.1版开始几何优化中途SCF没收敛就会直接报错,所以目前版本的Multiwfn产生的CP2K输入文件都有# IGNORE_CONVERGENCE_FAILURE一行,去掉注释就能恢复成之前版本的情况,即SCF不收敛也继续跑
作者
Author:
sobereva    时间: 2024-5-21 23:48
zjxitcc 发表于 2024-5-21 22:27
第一个结构这么用勉强可以,要是所有结构都这么用,岂不相当于高斯的IOp(5/13=1)

CP2K碰到SCF难收敛的几率比Gaussian高不少,尤其是初始结构比较差的时候。这个做法在从经验上来说可行,当然用户需要自行检验最后波函数收敛情况
作者
Author:
zhangs    时间: 2024-5-22 20:54
你好 请问这个问题您解决了吗?
作者
Author:
周志博    时间: 2024-5-23 15:50
r1ck 发表于 2024-5-21 21:11
把inp里IGNORE_CONVERGENCE_FAILUR前面的注释去掉

谢谢,这个方法我了解,但是想看能不能有其他解决办法
作者
Author:
周志博    时间: 2024-5-23 15:52
zhangs 发表于 2024-5-22 20:54
你好 请问这个问题您解决了吗?

暂时没解决,似乎只有去掉inp里IGNORE_CONVERGENCE_FAILUR前面的注释这个方法了
作者
Author:
周志博    时间: 2024-5-23 15:57
sobereva 发表于 2024-5-21 23:46
“短时间报错太多次,瞬时电流太大,导致主板烧坏”想象力真丰富

从CP2K 2024.1版开始几何优化中途SCF没 ...

谢谢老师指点。
主要是我之前运行脚本跑亥姆霍兹自由能计算的时候电脑主板烧坏了,才怀疑是否为短时间96个核心一块报错吗,导致电流增大,烧主板的。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3