计算化学公社

标题: 求教在超算增加核数但AIMD耗时不显著减少 [打印本页]

作者
Author:
白菜    时间: 2026-3-24 01:44
标题: 求教在超算增加核数但AIMD耗时不显著减少
老师们好~~~我租了机构的超算跑AIMD,测试了不同节点数和核数的耗时,但是增加核数不能显著减小耗时。看见sob老师说“主流双路服务器跑五六百原子纯泛函的AIMD完全没压力,属于很routine的计算”,这个超算的效率太低了。所以怀疑是不是编译有问题。想请老师们看看这个效率正常吗?

# 集群配置: CPU 2*Intel Xeon 8576C;单节点112核;主频2.5GHZ;内存 768GB。0.069元/核时。
# 测试体系: N H O Cl体系,640原子,PBE-D3,DZVP-MOLOPT-SR-GTH,CUTOFF=400;REL_CUTOFF=55;对角化+smearing
                  TIMESTEP=0.2,STEPS=20
# ================================================

排名节点×核/节点总核数平均SCF单步耗时(s)平均STEP耗时(s),除了step 1
151节点×64核642.07621.91
141节点×80核801.88419.72
71节点×96核961.43315.21
121节点×112核1121.55816.22
2节点×48核96超过20min还没结束,手动kill了
132节点×56核1121.64617.49
112节点×64核1281.47115.54
82节点×72核1441.46715.32
2节点×80核160超过20min还没结束,手动kill了
92节点×96核1921.48215.35
92节点×112核2241.49415.35
53节点×48核1441.37414.22
23节点×64核1921.24413.02
43节点×80核2401.35213.79
33节点×96核2881.28213.29
4节点×48核192超过20min还没结束,手动kill了
14节点×64核2561.07911.56
64节点×80核3201.48114.99







作者
Author:
Stardust0831    时间: 2026-3-24 02:43
看元素似乎不是什么金属导体之类的体系,或许可以试试看开OT?cp2k的OT挺黑科技的,我之前一些针对cp2k的测试中发现开OT时大体系的耗时的倒数几乎能和核数成正比。当然、对角化没道理才96核就最高效率了,这里的效率确实有点怪。确保是独占节点、排除同节点其他任务的影响;妥善考虑numa策略对效率的影响,必要时手动绑核;动力学轨迹有随机性,建议设定初始速度且只算1~2步,且同个条件跑多次。某些超算提供的环境本质上是个docker,这种情况下计算效率低于预期也很正常。
作者
Author:
sobereva    时间: 2026-3-24 08:06
640原子算不上很大体系,到了96核进一步提升速度的油水很小了。SCF一秒多一轮就已经算挺好了
作者
Author:
白菜    时间: 2026-3-24 09:18
嗯嗯好哒~谢谢sob老师~
作者
Author:
白菜    时间: 2026-3-24 09:19
Stardust0831 发表于 2026-3-24 02:43
看元素似乎不是什么金属导体之类的体系,或许可以试试看开OT?cp2k的OT挺黑科技的,我之前一些针对cp2k的测 ...

嗯嗯好哒,谢谢Stardust0831老师~我测试一下独占节点和手动绑核~




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3