计算化学公社

标题: 请问cp2k刚开始运行就中断如何解决? [打印本页]

作者
Author:
红茶泡枸杞    时间: 2023-7-11 11:22
标题: 请问cp2k刚开始运行就中断如何解决?
本帖最后由 红茶泡枸杞 于 2023-7-17 14:59 编辑

在学习cp2k过程中,我在sob老师博文<CP2K第一性原理程序在CentOS中的简易安装方法>中复制的例子,Multiwfn生成的2*2*2金刚石超胞做PBE/DZVP-MOLOPT-SR-GTH单点计算,cp2k可正常运行.
在sob老师另一篇博文<使用Multiwfn非常便利地创建CP2K程序的输入文件>中下载了另一个例子,做COF(共价有机框架)化合物的单点任务,采用centos8  cp2k2023.1无法运行,输入文件和输出文件如下
下面文件是cp2k.ssmp得到的,尝试cp2k.popt会出现如下字句
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 1 with PID 0 on node localhost exited on signal 9 (Killed).

不知是编译问题还是输入文件问题,请问该如何解决?








作者
Author:
sobereva    时间: 2023-7-11 12:06
若无特殊情况一律用popt版
贴出来popt版运行的命令和输出文件

ssmp版对于考虑k点的任务往往效率极低,而且你还只给了区区2个核,不慢才怪

作者
Author:
红茶泡枸杞    时间: 2023-7-11 12:50
sobereva 发表于 2023-7-11 12:06
若无特殊情况一律用popt版
贴出来popt版运行的命令和输出文件

好的,老师,这个是popt版运行命令,输出文件重新编辑在上面博文中
mpirun -np 2 cp2k.popt cof.inp |tee cof.out
作者
Author:
sobereva    时间: 2023-7-11 12:55
红茶泡枸杞 发表于 2023-7-11 12:50
好的,老师,这个是popt版运行命令,输出文件重新编辑在上面博文中
mpirun -np 2 cp2k.popt cof.inp |tee c ...

命令和输出文件没看出什么问题,估计纯粹就是CPU太慢
可以用个更小体系进行测试,比如金刚石原胞
作者
Author:
红茶泡枸杞    时间: 2023-7-11 13:18
本帖最后由 红茶泡枸杞 于 2023-7-11 13:22 编辑
sobereva 发表于 2023-7-11 12:55
命令和输出文件没看出什么问题,估计纯粹就是CPU太慢
可以用个更小体系进行测试,比如金刚石原胞

好的,谢谢老师,我是在自己的电脑上练习的,如果要计算的话,比如大一点的体系,在自己的电脑是无法计算的是吗?在服务器上会不会好一点呢?
作者
Author:
sobereva    时间: 2023-7-11 13:50
红茶泡枸杞 发表于 2023-7-11 13:18
好的,谢谢老师,我是在自己的电脑上练习的,如果要计算的话,比如大一点的体系,在自己的电脑是无法计算的是 ...


你的CPU物理核心有6个,给两核也太少了。给6核说不定还能凑合跑得动

另外,popt版如果是程序卡在那里,一直算但输出信息不更新,那是CPU性能的问题。如果是自动停掉了,那大概率是编译或者MPI库的问题。

作者
Author:
红茶泡枸杞    时间: 2023-7-11 13:57
sobereva 发表于 2023-7-11 13:50

你的CPU物理核心有6个,给两核也太少了。给6核说不定还能凑合跑得动

我明白了,谢谢老师.
作者
Author:
红茶泡枸杞    时间: 2023-7-11 14:30
sobereva 发表于 2023-7-11 13:50

你的CPU物理核心有6个,给两核也太少了。给6核说不定还能凑合跑得动

不好意思老师,我再问一下,我这次给了四核运行,屏幕上输出如下字句,是编译出错了吗?
--------------------------------------------------------------------------
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 3 with PID 0 on node localhost exited on signal 9 (Killed).
--------------------------------------------------------------------------
作者
Author:
zjxitcc    时间: 2023-7-11 15:05
你可以尝试安装和使用CP2K v2022.2,说不定问题就解决了。
作者
Author:
红茶泡枸杞    时间: 2023-7-11 15:15
zjxitcc 发表于 2023-7-11 15:05
你可以尝试安装和使用CP2K v2022.2,说不定问题就解决了。

好,我试一下,谢谢老师
作者
Author:
ahxb    时间: 2023-7-11 15:33
本帖最后由 ahxb 于 2023-7-11 15:35 编辑

看了一下输出文件,cp2k-popt.out的71至79行给出了内存信息,最主要的原因应该是内存不足,空闲内存只有约83MB(虽然71行写单位是Kb,但根据我自己跑出来的输出文件,单位应该是KB),实在是太少了。这个任务使用6核并行的话大概要6G内存,三四分钟就能算完。
其它运行中给出的报错很可能也是因为内存不够。

作者
Author:
红茶泡枸杞    时间: 2023-7-11 16:24
ahxb 发表于 2023-7-11 15:33
看了一下输出文件,cp2k-popt.out的71至79行给出了内存信息,最主要的原因应该是内存不足,空闲内存只有约8 ...

好的,谢谢老师,我下去再想想办法
作者
Author:
ddddnight    时间: 2023-7-12 12:13
红茶泡枸杞 发表于 2023-7-11 16:24
好的,谢谢老师,我下去再想想办法

请问你这个问题解决了吗
作者
Author:
红茶泡枸杞    时间: 2023-7-13 17:43
ddddnight 发表于 2023-7-12 12:13
请问你这个问题解决了吗

内存问题我不会搞,所以我把之前2023版的删了,现在在重新编译2022.2版的,尝试一下。
作者
Author:
PoorChaos    时间: 2023-7-14 10:37
虚拟机下运行的?
作者
Author:
红茶泡枸杞    时间: 2023-7-14 18:04
PoorChaos 发表于 2023-7-14 10:37
虚拟机下运行的?

是的
作者
Author:
红茶泡枸杞    时间: 2023-7-14 20:01
本帖最后由 红茶泡枸杞 于 2023-7-14 20:03 编辑
PoorChaos 发表于 2023-7-14 10:37
虚拟机下运行的?

centos8,cp2k2023
作者
Author:
PoorChaos    时间: 2023-7-14 22:38
红茶泡枸杞 发表于 2023-7-14 18:04
是的

虚拟机内存给的够不够呢
作者
Author:
红茶泡枸杞    时间: 2023-7-15 10:49
PoorChaos 发表于 2023-7-14 22:38
虚拟机内存给的够不够呢

给了50G的内存,不知道够不够
作者
Author:
红茶泡枸杞    时间: 2023-7-15 16:58
ddddnight 发表于 2023-7-12 12:13
请问你这个问题解决了吗

安装了2022.2版的,运行论坛下载的例子可以,但是算我自己的还是会出现上面的字句
作者
Author:
PoorChaos    时间: 2023-7-15 17:01
本帖最后由 PoorChaos 于 2023-7-15 17:07 编辑
红茶泡枸杞 发表于 2023-7-15 10:49
给了50G的内存,不知道够不够

用你给的cof.inp重新放进Multiwfn生成了新的cof.inp,正常跑完啊,22步收敛,inp和out放附件了
运行环境 RockyLinux 9.2,CP2K 2023.1,按社长教程编译
(, 下载次数 Times of downloads: 1) (, 下载次数 Times of downloads: 1)
(, 下载次数 Times of downloads: 9)



作者
Author:
红茶泡枸杞    时间: 2023-7-15 20:20
PoorChaos 发表于 2023-7-15 17:01
用你给的cof.inp重新放进Multiwfn生成了新的cof.inp,正常跑完啊,22步收敛,inp和out放附件了
运行环境  ...

谢谢老师回复,我重新编译了一下,可以正常跑了,请问出现这种字句可能是什么原因呢?
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 1 with PID 0 on node localhost exited on signal 9 (Killed).

作者
Author:
PoorChaos    时间: 2023-7-16 12:11
红茶泡枸杞 发表于 2023-7-15 20:20
谢谢老师回复,我重新编译了一下,可以正常跑了,请问出现这种字句可能是什么原因呢?
Primary job  ter ...

还是1楼的inp吗?
作者
Author:
红茶泡枸杞    时间: 2023-7-17 15:00
PoorChaos 发表于 2023-7-16 12:11
还是1楼的inp吗?

是的,我已上传到1楼,bdc.inp,谢谢
作者
Author:
anson    时间: 2023-7-17 16:07
本帖最后由 anson 于 2023-7-17 16:16 编辑
红茶泡枸杞 发表于 2023-7-17 15:00
是的,我已上传到1楼,bdc.inp,谢谢
(, 下载次数 Times of downloads: 2)    (, 下载次数 Times of downloads: 1)
rockylinux 9.2,cp2k-2023.1,调用4或36核都能正常跑完。
感觉你这有可能是虚拟机环境下给的内存比较少或者是磁盘空间不够。

作者
Author:
红茶泡枸杞    时间: 2023-7-17 17:20
anson 发表于 2023-7-17 16:07
rockylinux 9.2,cp2k-2023.1,调用4或36核都能正常跑完。
感觉你这有可能是虚拟机环境下给的内存比较 ...

明白了,我去增加内存,谢谢谢谢
作者
Author:
PoorChaos    时间: 2023-7-17 18:24
红茶泡枸杞 发表于 2023-7-17 17:20
明白了,我去增加内存,谢谢谢谢

硬盘空间也给够
作者
Author:
红茶泡枸杞    时间: 2023-7-17 20:16
PoorChaos 发表于 2023-7-17 18:24
硬盘空间也给够

现在100G,13.3G,可以算了,只是慢了点,十分感谢。
作者
Author:
红茶泡枸杞    时间: 2023-7-18 10:23
PoorChaos 发表于 2023-7-17 18:24
硬盘空间也给够

P老师,请问cp2k可以同时做多个计算类型吗?比如同时做几何优化、能力、频率
作者
Author:
啊不错的飞过海    时间: 2023-8-19 17:13
cp2k有自带的测试,编译完可以做一下看看情况;sdbg/pdbg版会在出问题时打印出完整的call stack、会检测内存泄露等cp2k的常见病害,有时间的话编译一份为好。
执行cp2k自带测试的命令:
  1. cd ${CP2K}
  2. make -j ARCH=... VERSION=... test
复制代码





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3