计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1053|回复 Reply: 7
打印 Print 上一主题 Last thread 下一主题 Next thread

[并行运算] cp2k的同一主板上两个CPU上运行时速度奇慢

[复制链接 Copy URL]

82

帖子

0

威望

596

eV
积分
678

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
各位大神:
我最近自己全手动搭建了HPC双机集群,现在发现一个特别神奇的事情。我的一个节点是2个CPU,分别为28核。如果我只用25个核,那么可以确保其只运行在同一主板上的一个CPU上,cp2k的电子步约为2.3秒,比官方docker文件还要快一点点。但是,一旦我使用49个核,那就是同一主板上的2个CPU上运行,电子步的时间变为4.2秒,但相同情况下,用docker镜像则为1.2秒。似乎用mpirun这个命令的时候,同一主板上的两个CPU感觉没有通信一样,有人遇到类似的情况吗?

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

2#
发表于 Post on 2023-5-26 02:14:47 | 只看该作者 Only view this author
说明用的什么CPU,计算时是单节点上跑的还是跨节点的
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

82

帖子

0

威望

596

eV
积分
678

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2023-5-26 07:27:26 来自手机 | 只看该作者 Only view this author
sobereva 发表于 2023-5-26 02:14
说明用的什么CPU,计算时是单节点上跑的还是跨节点的

cpu是intel 8173M,单节点跑的。我又用intel 2020 u4全家桶重新编译了cp2k 2023.1。速度一下提上来了,估计是和我用的openhpc的并行环境有关,就是搞不懂为啥一个CPU上这么快,同节点2个CPU就不行,多半是并行设置的问题。

82

帖子

0

威望

596

eV
积分
678

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2023-5-26 07:30:57 来自手机 | 只看该作者 Only view this author
上述回复少了一个字,是单节点。

125

帖子

0

威望

2268

eV
积分
2393

Level 5 (御坂)

5#
发表于 Post on 2023-5-26 08:48:21 | 只看该作者 Only view this author
我用双路6231(单颗14核),只用14核跑MD时单步耗时400多秒,停掉后续算用27核刚开始每步只要三四十秒,然后后面又降到了三四百秒。我怀疑是不是硬盘读写速度限制?用的4T 7200rpm日立机械盘,Centos stream9系统装在480G SSD上

82

帖子

0

威望

596

eV
积分
678

Level 4 (黑子)

6#
 楼主 Author| 发表于 Post on 2023-5-26 12:34:05 来自手机 | 只看该作者 Only view this author
fineren 发表于 2023-5-26 08:48
我用双路6231(单颗14核),只用14核跑MD时单步耗时400多秒,停掉后续算用27核刚开始每步只要三四十秒,然 ...

应该不能是硬盘的问题,我用Intel mpi就没问题,openmpi和mpich都慢

125

帖子

0

威望

2268

eV
积分
2393

Level 5 (御坂)

7#
发表于 Post on 2023-5-26 15:18:34 | 只看该作者 Only view this author
leeru 发表于 2023-5-26 12:34
应该不能是硬盘的问题,我用Intel mpi就没问题,openmpi和mpich都慢

看前面的说法还是docker安装的比较快,但是试了一次失败了,希望哪位给个更详细的教程

82

帖子

0

威望

596

eV
积分
678

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2023-5-26 16:26:00 来自手机 | 只看该作者 Only view this author
fineren 发表于 2023-5-26 15:18
看前面的说法还是docker安装的比较快,但是试了一次失败了,希望哪位给个更详细的教程

docker或者singularity单机版快,但我要跨节点,还是IB卡连接的,不太会整IB卡的singularity

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:26 , Processed in 0.978579 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list