计算化学公社

 找回密码 Forget password
 注册 Register
Views: 10128|回复 Reply: 3
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] cp2k8.1部分节点并行出错

[复制链接 Copy URL]

3

帖子

0

威望

113

eV
积分
116

Level 2 能力者

各位老师和同学,按照http://sobereva.com/586群主的方法编译成功了cp2k8.1版本,用到了source /opt/intel/parallel_studio_xe_2018.0.033/bin/psxevars.sh

结果提交作业的时候只有两个节点能使用,其他节点都提示出错:
信息如下:
作业脚本文件已经加上了source /home/student/siesta/cp2k-8.1/tools/toolchain/install/setup
错误信息如下:

SCF WAVEFUNCTION OPTIMIZATION

  Step     Update method      Time    Convergence         Total energy    Change
  ------------------------------------------------------------------------------

*******************************************************************************
*   ___                                                                       *
*  /   \                                                                      *
* [ABORT]                                                                     *
*  \___/                   Setting the ELPA real_kernel failed                *
*    |                                                                        *
*  O/|                                                                        *
* /| |                                                                        *
* / \                                                     fm/cp_fm_elpa.F:474 *
*******************************************************************************



===== Routine Calling Stack =====

           10 cp_fm_diag_elpa_base
            9 cp_fm_diag_elpa
            8 eigensolver
            7 qs_scf_new_mos
            6 scf_env_do_scf_inner_loop
            5 scf_env_do_scf
            4 qs_energies
            3 qs_forces
            2 qs_mol_dyn_low
            1 CP2K

以上部分在文件最后连续出现好几次,应该是并行出现了问题,但是部分节点就没有问题。

请各位大佬帮忙,感谢

691

帖子

2

威望

4250

eV
积分
4981

Level 6 (一方通行)

2#
发表于 Post on 2021-7-1 15:15:24 | 只看该作者 Only view this author
你编译完后有没有测试一下例子文件 看是否正常,另外如果elpa不是必须的话 可以在重新编译的时候不要加入,看看是否能解决

3

帖子

0

威望

113

eV
积分
116

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2021-7-2 08:41:31 | 只看该作者 Only view this author
例子文件是正常的,而且在部分节点上可以进行正常的计算的。只是把作业提交的其他节点的就会出现上面的错误/
我怀疑可能是环境变量哪里出问题了,但是改了半天也不对。
如果想用mpirun并行的话是不是必须要用到elpa?(我也不清楚)。
之前装过一个ssmp多线程的版本,但是要比popt的版本慢近三倍。

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

4#
发表于 Post on 2021-7-2 12:18:56 | 只看该作者 Only view this author
xiaoboy 发表于 2021-7-2 08:41
例子文件是正常的,而且在部分节点上可以进行正常的计算的。只是把作业提交的其他节点的就会出现上面的错误 ...

集群设定问题。

如有集群运维管理员,找他。

或者自己解决。

或者, 我估计也能解决, 有偿。 联系方式看签名。
祝好。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-18 16:21 , Processed in 0.229749 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list