计算化学公社

标题: cp2k8.1部分节点并行出错 [打印本页]

作者
Author:
xiaoboy    时间: 2021-7-1 10:33
标题: cp2k8.1部分节点并行出错
各位老师和同学,按照http://sobereva.com/586群主的方法编译成功了cp2k8.1版本,用到了source /opt/intel/parallel_studio_xe_2018.0.033/bin/psxevars.sh

结果提交作业的时候只有两个节点能使用,其他节点都提示出错:
信息如下:
作业脚本文件已经加上了source /home/student/siesta/cp2k-8.1/tools/toolchain/install/setup
错误信息如下:

SCF WAVEFUNCTION OPTIMIZATION

  Step     Update method      Time    Convergence         Total energy    Change
  ------------------------------------------------------------------------------

*******************************************************************************
*   ___                                                                       *
*  /   \                                                                      *
* [ABORT]                                                                     *
*  \___/                   Setting the ELPA real_kernel failed                *
*    |                                                                        *
*  O/|                                                                        *
* /| |                                                                        *
* / \                                                     fm/cp_fm_elpa.F:474 *
*******************************************************************************



===== Routine Calling Stack =====

           10 cp_fm_diag_elpa_base
            9 cp_fm_diag_elpa
            8 eigensolver
            7 qs_scf_new_mos
            6 scf_env_do_scf_inner_loop
            5 scf_env_do_scf
            4 qs_energies
            3 qs_forces
            2 qs_mol_dyn_low
            1 CP2K

以上部分在文件最后连续出现好几次,应该是并行出现了问题,但是部分节点就没有问题。

请各位大佬帮忙,感谢


作者
Author:
jiangning198511    时间: 2021-7-1 15:15
你编译完后有没有测试一下例子文件 看是否正常,另外如果elpa不是必须的话 可以在重新编译的时候不要加入,看看是否能解决
作者
Author:
xiaoboy    时间: 2021-7-2 08:41
例子文件是正常的,而且在部分节点上可以进行正常的计算的。只是把作业提交的其他节点的就会出现上面的错误/
我怀疑可能是环境变量哪里出问题了,但是改了半天也不对。
如果想用mpirun并行的话是不是必须要用到elpa?(我也不清楚)。
之前装过一个ssmp多线程的版本,但是要比popt的版本慢近三倍。
作者
Author:
abin    时间: 2021-7-2 12:18
xiaoboy 发表于 2021-7-2 08:41
例子文件是正常的,而且在部分节点上可以进行正常的计算的。只是把作业提交的其他节点的就会出现上面的错误 ...

集群设定问题。

如有集群运维管理员,找他。

或者自己解决。

或者, 我估计也能解决, 有偿。 联系方式看签名。
祝好。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3