计算化学公社

标题: 求助:OPENMPI并行VASP在使用一段时间后失效的问题 [打印本页]

作者
Author:
jedi_1314    时间: 2024-12-6 02:50
标题: 求助:OPENMPI并行VASP在使用一段时间后失效的问题
各位老师好,我使用AOCC_AOCL_OpenMPI成功编译VASP后,进行了测试,使用NCORE=6,mpirun -np 24能跑出理想的速度,并且在运行之后也显示running   24 mpi-ranks, on    1 nodes 。
后面电脑经历了几次开关机,安装过诸如pymatgen等软件后,我进行了实战,使用的依然是NCORE=6,mpirun -np 24,但是返回的却是running   1 mpi-ranks, on    1 nodes。后台24个核心全部被占用,根据结果可以看出现在是用24个核心分别去跑这个实战案例。
于是,我重新跑了测试案例,这时候在NCORE=6,mpirun -np 24下,测试案例也返回running   1 mpi-ranks, on    1 nodes,也是24个核心在分别跑测试案例,请问公社里的老师们,遇到这种情况该怎么排查问题所在。

作者
Author:
abin    时间: 2024-12-6 09:21
使用调度器/work load manager,
比如slurm
勿手动控制MPI进程。
作者
Author:
jedi_1314    时间: 2024-12-6 17:17
abin 发表于 2024-12-6 09:21
使用调度器/work load manager,
比如slurm
勿手动控制MPI进程。

谢谢老师回答,我尝试一下slurm。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3