计算化学公社

 找回密码 Forget password
 注册 Register
Views: 6603|回复 Reply: 14
打印 Print 上一主题 Last thread 下一主题 Next thread

[硬件相关] 双路E5-2699v4,断电重启后仅一路可用

[复制链接 Copy URL]

10

帖子

0

威望

743

eV
积分
753

Level 4 (黑子)

本帖最后由 郑汉良很潇洒 于 2019-2-20 08:51 编辑

       各位老师,我们实验室的一台服务器是双路E5-2699v4的,每个CPU有22个物理核心,所以我们机子一共44个物理核心,88线程。前不久突然断电,来电重启之后,发现有一个CPU不工作。       在使用g16时,使用22线程的速度,与使用44线程的速度几乎差不多,若调用超过44线程,如用%nprocshared=64, 速度仍然几乎差不多。也就是另外一个CPU没有在工作。
       检查BIOS里面,发现两个CPU都在线。在teminal 里用lscpu命令查看cpu时,也正确显示的是88线程都在线。但是就是无法调用。请教各位老师有什么解决方法?


g16-error.png (10.27 KB, 下载次数 Times of downloads: 48)

g16使用66线程报错

g16使用66线程报错

lscpu.png (32.6 KB, 下载次数 Times of downloads: 53)

lscpu信息

lscpu信息

125

帖子

0

威望

3505

eV
积分
3630

Level 5 (御坂)

アルトリア・ペンドラゴン

2#
发表于 Post on 2019-2-19 22:29:51 | 只看该作者 Only view this author
关闭超线程,再调用44核心试试

125

帖子

0

威望

3505

eV
积分
3630

Level 5 (御坂)

アルトリア・ペンドラゴン

3#
发表于 Post on 2019-2-19 22:31:38 | 只看该作者 Only view this author
印象中,G16是不能够用64线程以上吧

10

帖子

0

威望

743

eV
积分
753

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2019-2-19 22:31:40 | 只看该作者 Only view this author
njfuzjs 发表于 2019-2-19 22:29
关闭超线程,再调用44核心试试

好的,谢谢老师!我明天去试试看。

10

帖子

0

威望

743

eV
积分
753

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2019-2-19 22:34:54 | 只看该作者 Only view this author
njfuzjs 发表于 2019-2-19 22:31
印象中,G16是不能够用64线程以上吧

emmm...这个我还不知道。。我平常也不会用这么多,我刚就想试试看是不是另外一个CPU真的不工作。不过看22线程和44线程的结果来看,确实是有一个CPU没有在工作。

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

6#
发表于 Post on 2019-2-20 00:07:43 | 只看该作者 Only view this author
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

按此文说的,通过指定%CPU反复测试弄明白是什么情况
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

10

帖子

0

威望

743

eV
积分
753

Level 4 (黑子)

7#
 楼主 Author| 发表于 Post on 2019-2-20 08:33:56 | 只看该作者 Only view this author
sobereva 发表于 2019-2-20 00:07
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

好的!谢谢社长大大!

516

帖子

1

威望

5052

eV
积分
5588

Level 6 (一方通行)

8#
发表于 Post on 2019-2-20 09:12:02 | 只看该作者 Only view this author
用那么多线程,速度不变很正常,甚至速度下降都正常

516

帖子

1

威望

5052

eV
积分
5588

Level 6 (一方通行)

9#
发表于 Post on 2019-2-20 09:13:25 | 只看该作者 Only view this author
这种多核的CPU适合同时交两个作业,但是主频又不怎么高,好尴尬

10

帖子

0

威望

743

eV
积分
753

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2019-2-20 09:22:13 | 只看该作者 Only view this author
niobium 发表于 2019-2-20 09:12
用那么多线程,速度不变很正常,甚至速度下降都正常

总共44个物理核心的话,调用44线程的速度应该是22线程的2倍不到一些,但是这里速度几乎差不多。。。所以我觉得有一半的物理核心没有在工作

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

11#
发表于 Post on 2019-2-20 09:46:00 | 只看该作者 Only view this author
郑汉良很潇洒 发表于 2019-2-20 09:22
总共44个物理核心的话,调用44线程的速度应该是22线程的2倍不到一些,但是这里速度几乎差不多。。。所以 ...

此贴中有过评测:
http://bbs.keinsci.com/thread-11691-1-1.html
同一个计算
E5-2699V4(4*32G内存) %nproc=20 %mem=50GB :3 min 27 s
E5-2699V4 (4*32G内存)%nproc=44 %mem=100GB:2 min 55 s
2倍不到一些是理想情况吧,真是情况还要考虑到多核并行效率的问题

516

帖子

1

威望

5052

eV
积分
5588

Level 6 (一方通行)

12#
发表于 Post on 2019-2-20 10:00:43 | 只看该作者 Only view this author
郑汉良很潇洒 发表于 2019-2-20 09:22
总共44个物理核心的话,调用44线程的速度应该是22线程的2倍不到一些,但是这里速度几乎差不多。。。所以 ...

不是这样。。这要看程序的并行写得好不好

10

帖子

0

威望

743

eV
积分
753

Level 4 (黑子)

13#
 楼主 Author| 发表于 Post on 2019-2-20 10:03:23 | 只看该作者 Only view this author
dreamyeye 发表于 2019-2-20 09:46
此贴中有过评测:
http://bbs.keinsci.com/thread-11691-1-1.html
同一个计算

我们之前机器没问题的时候,对目前的体系测试过,使用44线程时,elapsed time是2min 20s, 22线程是4min左右, 11线程则是8min 30秒左右。现在44线程耗时4min了,和以前的情况来看确实是少了一半的工作核心

10

帖子

0

威望

743

eV
积分
753

Level 4 (黑子)

14#
 楼主 Author| 发表于 Post on 2019-2-20 10:54:23 | 只看该作者 Only view this author
sobereva 发表于 2019-2-20 00:07
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

社长,我刚测试好。对于目前测试的任务,在机器没问题的情况下,%nprocshared=44时,耗时2min30s, 22线程是4min0s左右, 11线程则是8min20s左右。
0-21,44-65线程是一个socket的,共用22个物理核心的。22-43,66-87另外一个socket,共用另外22物理核心的。
目使用%CPU测试的情况是:%CPU=0-10时,耗时8min16s;%CPU=0-21时,耗时8min30s;%CPU=22-43时,耗时8min30s;%CPU=0-43时,耗时4min30s。所以似乎是两个CPU都在工作,但每个CPU都只能使用一半的物理核心?

195

帖子

0

威望

4029

eV
积分
4224

Level 6 (一方通行)

15#
发表于 Post on 2019-6-11 19:05:43 | 只看该作者 Only view this author
可以安装i7z监控CPU运行状况

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 21:02 , Processed in 0.710095 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list