计算化学公社

 找回密码 Forget password
 注册 Register
Views: 21409|回复 Reply: 23
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] 求助 最近一直出现这个问题 老是自动停止任务了

[复制链接 Copy URL]

70

帖子

0

威望

906

eV
积分
976

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 萧瑟 于 2025-3-20 16:09 编辑

Program received signal SIGSEGV: Segmentation fault - invalid memory reference.
Backtrace for this error:
#31  0x560f1df42f7e in main
        at ~/task/cp2k/src/start/cp2k.F:44
--------------------------------------------------------------------------
Primary job  terminated normally, but 1 process returned
a non-zero exit code. Per user-direction, the job has been aborted.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that process rank 0 with PID 0 on node xxxxx exited on signal 11 (Segmentation fault).

一般来看这个问题还是有很多同学会碰到,我会把一些经验及收集到的信息在此贴不定期更新,希望能帮助到大家。
最初遇到这个问题是初次接触理论计算,服务器和CP2K,一些问题没有注意
1)服务器本身内存受限。和运行游戏一样,不同体量的程序运行需要的内存大小都不一样,如果硬件不满足自然会崩溃出错;
2)下楼有大佬指出某些版本的openMPI(IntelMPI)可能会存在持续占用内存直到内存爆掉然后停止任务,更换版本也是一种解决办法;
3)对于振动分析、过渡态搜索等任务需要分一个或多个任务(副本)同时进行计算的,副本数越多所需内存也越大,可以把副本数减少一些,以降低内存占用的压力;


70

帖子

0

威望

906

eV
积分
976

Level 4 (黑子)

2#
 楼主 Author| 发表于 Post on 2021-6-26 21:32:32 | 只看该作者 Only view this author
本帖最后由 萧瑟 于 2021-6-26 21:40 编辑

服务器上监测  内存的使用率快速增加到2/3 任务就停了  不知道是什么问题   

pd.inp

7.93 KB, 下载次数 Times of downloads: 21

2407

帖子

1

威望

5955

eV
积分
8382

Level 6 (一方通行)

3#
发表于 Post on 2021-6-27 15:29:38 | 只看该作者 Only view this author
这玩意叫做“MPI内存爆浆”。

有没有100%用官方推荐的方案? 我指的是toolchain。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

70

帖子

0

威望

906

eV
积分
976

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2021-6-27 15:34:02 | 只看该作者 Only view this author
abin 发表于 2021-6-27 15:29
这玩意叫做“MPI内存爆浆”。

有没有100%用官方推荐的方案? 我指的是toolchain。

基本是按 sob老师的博文 使用的toolchain   遇到的一些问题就是SIRIUS 没有装

70

帖子

0

威望

906

eV
积分
976

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2021-6-27 15:34:51 | 只看该作者 Only view this author
abin 发表于 2021-6-27 15:29
这玩意叫做“MPI内存爆浆”。

有没有100%用官方推荐的方案? 我指的是toolchain。

请问要怎么解决?

2407

帖子

1

威望

5955

eV
积分
8382

Level 6 (一方通行)

6#
发表于 Post on 2021-6-27 16:47:23 | 只看该作者 Only view this author
萧瑟 发表于 2021-6-27 15:34
请问要怎么解决?

使用7.1试试。

或者给我你的输入文件,我用我的版本试试。

你的机器什么配置,跑了多久出现的问题。

如果你认为编译没有问题,就是github发issue。

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

70

帖子

0

威望

906

eV
积分
976

Level 4 (黑子)

7#
 楼主 Author| 发表于 Post on 2021-6-27 17:24:09 | 只看该作者 Only view this author
abin 发表于 2021-6-27 16:47
使用7.1试试。

或者给我你的输入文件,我用我的版本试试。

输入文件放在2楼   机器比较一般  12核v2690的cpu  内存16

2407

帖子

1

威望

5955

eV
积分
8382

Level 6 (一方通行)

8#
发表于 Post on 2021-6-27 17:29:39 | 只看该作者 Only view this author
萧瑟 发表于 2021-6-27 17:24
输入文件放在2楼   机器比较一般  12核v2690的cpu  内存16

Send the input file to hpc4you@163.com.

And make clear how to run this calculation.

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

9#
发表于 Post on 2021-11-18 10:03:09 | 只看该作者 Only view this author
萧瑟 发表于 2021-6-27 17:24
输入文件放在2楼   机器比较一般  12核v2690的cpu  内存16

楼主解决了吗?我也遇到同样的问题

70

帖子

0

威望

906

eV
积分
976

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2021-11-22 09:49:48 | 只看该作者 Only view this author
孙小莫 发表于 2021-11-18 10:03
楼主解决了吗?我也遇到同样的问题

好像是内存不够用了,我之前一直在摸索,所以算了很多失败的例子   每次都会生成一个很大的 .kp 文件很占内存,清理一下就好了

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

11#
发表于 Post on 2021-11-22 11:00:27 | 只看该作者 Only view this author
萧瑟 发表于 2021-11-22 09:49
好像是内存不够用了,我之前一直在摸索,所以算了很多失败的例子   每次都会生成一个很大的 .kp 文件很占 ...

感谢楼主应答,我也经过一段时间摸索,感觉像是系统的mpi和cp2k的mpi没有匹配,在单核计算时就完全没有这个情况

207

帖子

1

威望

1433

eV
积分
1660

Level 5 (御坂)

12#
发表于 Post on 2023-4-26 19:26:43 | 只看该作者 Only view this author
孙小莫 发表于 2021-11-22 11:00
感谢楼主应答,我也经过一段时间摸索,感觉像是系统的mpi和cp2k的mpi没有匹配,在单核计算时就完全没有这 ...

那请问怎么解决的呢

128

帖子

1

威望

429

eV
积分
577

Level 4 (黑子)

13#
发表于 Post on 2023-4-26 20:12:00 | 只看该作者 Only view this author
萧瑟 发表于 2021-11-22 09:49
好像是内存不够用了,我之前一直在摸索,所以算了很多失败的例子   每次都会生成一个很大的 .kp 文件很占 ...

注意区分“内存”和“硬盘”

128

帖子

1

威望

429

eV
积分
577

Level 4 (黑子)

14#
发表于 Post on 2023-4-26 20:16:14 | 只看该作者 Only view this author
CP2K搭配某些特定版本的MPI时会有内存泄漏问题,表现就是内存占用量越来越大直到内存爆掉程序停止运行。解决办法是换一个版本的MPI。一般来说如果是同一种MPI(Intel MPI/OpenMPI)换版本不需要重新编译,只要弄好MPI的环境即可

70

帖子

0

威望

906

eV
积分
976

Level 4 (黑子)

15#
 楼主 Author| 发表于 Post on 2023-4-27 13:03:48 | 只看该作者 Only view this author
DoorBell 发表于 2023-4-26 20:16
CP2K搭配某些特定版本的MPI时会有内存泄漏问题,表现就是内存占用量越来越大直到内存爆掉程序停止运行。解 ...

了解,谢谢老师

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-15 17:00 , Processed in 0.312616 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list