计算化学公社

标题: -ntomp核心数怎么选择让模拟速度更快?运行时发现80核预计运行时间比40核多一年左右 [打印本页]

作者
Author:
Wqyin    时间: 2025-5-10 16:47
标题: -ntomp核心数怎么选择让模拟速度更快?运行时发现80核预计运行时间比40核多一年左右
本帖最后由 Wqyin 于 2025-5-10 20:43 编辑

我先在超算平台上申请了40核,运行md模拟时,尝试将-ntomp分别设置为20 30 35 40,结果发现预计运行时间快到慢依次为30>20>35>40。
然后我重新申请了2个节点、共80核,再次运行同一md模拟,发现无论-ntomp设置为多少,预计运行时间都比上面申请40核的多一年左右,这是为什么?
这种情况的话,请问我应该怎么设置或者测试,以让该md模拟作业正式提交到超算平台时运行更快一些?
麻烦各位老师、前辈指点一下。

作者
Author:
abin    时间: 2025-5-10 16:58
没IB设备的机器,
以及你的MPI不支持IB的场景,
以及编译的时候,未合理适配IB设备的场景,
建议,尽量单机多核心并行……
如有选择空间,建议优先采用2^n个核心。
核心越多跑越快,是有前提的。

付费的超算,并不提供调优建议的……
或许,你跑得越慢,才最符合商家预期的设定。
作者
Author:
Wqyin    时间: 2025-5-10 17:31
abin 发表于 2025-5-10 16:58
没IB设备的机器,
以及你的MPI不支持IB的场景,
以及编译的时候,未合理适配IB设备的场景,

明白了。多谢前辈指点。
作者
Author:
sobereva    时间: 2025-5-10 17:59
这年头大家普遍都用GPU跑,你用个GPU像样的笔记本跑gromacs都比你用80核的超算CPU跑更快,而且跨节点更是损耗性能。倘若你的超算上就是用的GPU跑,事先说清楚。
另外,纯CPU跑时OpenMP线程不宜太多,一般建议<=8个,与thread-MPI线程数的乘积等于总物理核心数。

作者
Author:
Wqyin    时间: 2025-5-10 20:41
本帖最后由 Wqyin 于 2025-5-10 20:42 编辑
sobereva 发表于 2025-5-10 17:59
这年头大家普遍都用GPU跑,你用个GPU像样的笔记本跑gromacs都比你用80核的超算CPU跑更快,而且跨节点更是损 ...

了解了,多谢社长。以上确实是纯CPU跑的,目前也确实没办法实现用GPU的比较好的计算机跑。
然后我想问一下,我的体系原子数大概5.3万,如果结合对比intelMPI,怎么分配会更好一些:是单节点thrad-MPI还是2节点intel-MPI好一些?
作者
Author:
sobereva    时间: 2025-5-10 22:58
Wqyin 发表于 2025-5-10 20:41
了解了,多谢社长。以上确实是纯CPU跑的,目前也确实没办法实现用GPU的比较好的计算机跑。
然后我想问一 ...

单节点thread-MPI
作者
Author:
Wqyin    时间: 2025-5-11 15:59
sobereva 发表于 2025-5-10 22:58
单节点thread-MPI

了解!谢谢社长




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3