计算化学公社

标题: 双路E5-2699v4,断电重启后仅一路可用 [打印本页]

作者
Author:
郑汉良很潇洒    时间: 2019-2-19 22:25
标题: 双路E5-2699v4,断电重启后仅一路可用
本帖最后由 郑汉良很潇洒 于 2019-2-20 08:51 编辑

       各位老师,我们实验室的一台服务器是双路E5-2699v4的,每个CPU有22个物理核心,所以我们机子一共44个物理核心,88线程。前不久突然断电,来电重启之后,发现有一个CPU不工作。       在使用g16时,使用22线程的速度,与使用44线程的速度几乎差不多,若调用超过44线程,如用%nprocshared=64, 速度仍然几乎差不多。也就是另外一个CPU没有在工作。
       检查BIOS里面,发现两个CPU都在线。在teminal 里用lscpu命令查看cpu时,也正确显示的是88线程都在线。但是就是无法调用。请教各位老师有什么解决方法?



作者
Author:
njfuzjs    时间: 2019-2-19 22:29
关闭超线程,再调用44核心试试
作者
Author:
njfuzjs    时间: 2019-2-19 22:31
印象中,G16是不能够用64线程以上吧
作者
Author:
郑汉良很潇洒    时间: 2019-2-19 22:31
njfuzjs 发表于 2019-2-19 22:29
关闭超线程,再调用44核心试试

好的,谢谢老师!我明天去试试看。
作者
Author:
郑汉良很潇洒    时间: 2019-2-19 22:34
njfuzjs 发表于 2019-2-19 22:31
印象中,G16是不能够用64线程以上吧

emmm...这个我还不知道。。我平常也不会用这么多,我刚就想试试看是不是另外一个CPU真的不工作。不过看22线程和44线程的结果来看,确实是有一个CPU没有在工作。
作者
Author:
sobereva    时间: 2019-2-20 00:07
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

按此文说的,通过指定%CPU反复测试弄明白是什么情况
作者
Author:
郑汉良很潇洒    时间: 2019-2-20 08:33
sobereva 发表于 2019-2-20 00:07
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

好的!谢谢社长大大!
作者
Author:
niobium    时间: 2019-2-20 09:12
用那么多线程,速度不变很正常,甚至速度下降都正常

作者
Author:
niobium    时间: 2019-2-20 09:13
这种多核的CPU适合同时交两个作业,但是主频又不怎么高,好尴尬
作者
Author:
郑汉良很潇洒    时间: 2019-2-20 09:22
niobium 发表于 2019-2-20 09:12
用那么多线程,速度不变很正常,甚至速度下降都正常

总共44个物理核心的话,调用44线程的速度应该是22线程的2倍不到一些,但是这里速度几乎差不多。。。所以我觉得有一半的物理核心没有在工作
作者
Author:
dreamyeye    时间: 2019-2-20 09:46
郑汉良很潇洒 发表于 2019-2-20 09:22
总共44个物理核心的话,调用44线程的速度应该是22线程的2倍不到一些,但是这里速度几乎差不多。。。所以 ...

此贴中有过评测:
http://bbs.keinsci.com/thread-11691-1-1.html
同一个计算
E5-2699V4(4*32G内存) %nproc=20 %mem=50GB :3 min 27 s
E5-2699V4 (4*32G内存)%nproc=44 %mem=100GB:2 min 55 s
2倍不到一些是理想情况吧,真是情况还要考虑到多核并行效率的问题
作者
Author:
niobium    时间: 2019-2-20 10:00
郑汉良很潇洒 发表于 2019-2-20 09:22
总共44个物理核心的话,调用44线程的速度应该是22线程的2倍不到一些,但是这里速度几乎差不多。。。所以 ...

不是这样。。这要看程序的并行写得好不好
作者
Author:
郑汉良很潇洒    时间: 2019-2-20 10:03
dreamyeye 发表于 2019-2-20 09:46
此贴中有过评测:
http://bbs.keinsci.com/thread-11691-1-1.html
同一个计算

我们之前机器没问题的时候,对目前的体系测试过,使用44线程时,elapsed time是2min 20s, 22线程是4min左右, 11线程则是8min 30秒左右。现在44线程耗时4min了,和以前的情况来看确实是少了一半的工作核心
作者
Author:
郑汉良很潇洒    时间: 2019-2-20 10:54
sobereva 发表于 2019-2-20 00:07
正确看待超线程(HT)技术对计算化学运算的影响
http://sobereva.com/392

社长,我刚测试好。对于目前测试的任务,在机器没问题的情况下,%nprocshared=44时,耗时2min30s, 22线程是4min0s左右, 11线程则是8min20s左右。
0-21,44-65线程是一个socket的,共用22个物理核心的。22-43,66-87另外一个socket,共用另外22物理核心的。
目使用%CPU测试的情况是:%CPU=0-10时,耗时8min16s;%CPU=0-21时,耗时8min30s;%CPU=22-43时,耗时8min30s;%CPU=0-43时,耗时4min30s。所以似乎是两个CPU都在工作,但每个CPU都只能使用一半的物理核心?
作者
Author:
tiandikuoyuan    时间: 2019-6-11 19:05
可以安装i7z监控CPU运行状况




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3