计算化学公社

标题: 求助,关于集群上gromacs的mpi并行问题 [打印本页]

作者
Author:
HONEYJ    时间: 2021-6-28 21:14
标题: 求助,关于集群上gromacs的mpi并行问题
本帖最后由 HONEYJ 于 2021-6-28 21:24 编辑

各位老师好,我在集群上安装了gromacs的mpi版本,参照sob老师的帖子《GROMACS的安装方法》(bbs.keinsci.com/thread-11821-1-4.html)。cmake采用的时3.14,openmpi用的3.0在提交脚本做计算时遇到了下面两个问题,还请各位大大能够答疑解惑。
1、集群队列显示加载的cpu核数严重超出了节点的核数,节点实际可用24个核,加载显示几百个。图中node21和node23。
(, 下载次数 Times of downloads: 27)
2、计算结果的每一帧都是单独输出的,会覆盖之前的输出结果,不像单机版上的是输出在一个(xtc,edr,log)文件中。
(, 下载次数 Times of downloads: 28)
下面是我的pbs脚本
(, 下载次数 Times of downloads: 18)









作者
Author:
abin    时间: 2021-6-28 21:45
mpirun -np XXX
与 mdrun 是否冲突?

暂时手动设定 mpirun -np 48如何?
作者
Author:
HONEYJ    时间: 2021-6-28 22:23
abin 发表于 2021-6-28 21:45
mpirun -np XXX
与 mdrun 是否冲突?

您好,非常感谢您的回复。命令是照着帖子里sob老师写的,尝试过设置np=48,还是出现一样的问题。
作者
Author:
abin    时间: 2021-6-28 22:55
HONEYJ 发表于 2021-6-28 22:23
您好,非常感谢您的回复。命令是照着帖子里sob老师写的,尝试过设置np=48,还是出现一样的问题。

我说的,你也没有完全测试呀……

这是要大家猜谜语呀……
作者
Author:
sobereva    时间: 2021-6-29 05:34
你是要跨节点并行?
作者
Author:
HONEYJ    时间: 2021-6-29 09:21
sobereva 发表于 2021-6-29 05:34
你是要跨节点并行?

嗯,是的,sob老师。抱歉在主贴没有说清楚,还请sob老师能够指点一二。
作者
Author:
sobereva    时间: 2021-6-30 03:17
HONEYJ 发表于 2021-6-29 09:21
嗯,是的,sob老师。抱歉在主贴没有说清楚,还请sob老师能够指点一二。

我对PBS不清楚,但大概率是并行不成功。你先试试在单个节点上用MPI版gmx能否正常并行
作者
Author:
HONEYJ    时间: 2021-6-30 10:19
abin 发表于 2021-6-28 22:55
我说的,你也没有完全测试呀……

这是要大家猜谜语呀……

老师,您好,不存在这个冲突。如果不加mdrun的话,任务跑不起来。
作者
Author:
HONEYJ    时间: 2021-6-30 10:37
本帖最后由 HONEYJ 于 2021-6-30 16:11 编辑
sobereva 发表于 2021-6-30 03:17
我对PBS不清楚,但大概率是并行不成功。你先试试在单个节点上用MPI版gmx能否正常并行

sob老师,单节点并行时出现的问题和跨节点效果是一样的。每一帧结果也是单独输出,不会输出在一个文件里面。
作者
Author:
sobereva    时间: 2021-7-1 02:37
HONEYJ 发表于 2021-6-30 10:37
sob老师,单节点并行时出现的问题和跨节点效果是一样的。每一帧结果也是单独输出,不会输出在一个文件里 ...

应该就是MPI库的问题,确保当前处于可用状态的MPI库和编译的时候是同一个MPI
也可以尝试换成其它MPI库重新编译
作者
Author:
HONEYJ    时间: 2021-7-1 09:29
sobereva 发表于 2021-7-1 02:37
应该就是MPI库的问题,确保当前处于可用状态的MPI库和编译的时候是同一个MPI
也可以尝试换成其它MPI库重 ...

我试一下,谢谢社长




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3