计算化学公社

 找回密码 Forget password
 注册 Register
Views: 12890|回复 Reply: 23
打印 Print 上一主题 Last thread 下一主题 Next thread

[硬件评测] CPU调用情况似乎有异常——Intel Scalable Silver 4114 初测——现已真相大白

[复制链接 Copy URL]

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

本帖最后由 dreamyeye 于 2018-12-27 21:52 编辑

新入手一台Intel Scalable Silver 4114*2(10C20T, 2.2GHz),其余配置是镁光DDR4 2666MHz(由于CPU不支持这么高,实际运行是2400MHz)16G*4, 4T企业级机械硬盘 系统为CentOS 7.5
虽然配置属于比较低端的,但是也是Scalable系列首次尝试,入手后,抓紧评测

首先想到的例子就是经典的test0397,20核开动起来,算呀!结果发现在L101,L202,L301这些以前都是秒过的link,居然都要停很长一段时间,感觉有所不正常,于是想比较一番,手头也有同是2.2GHz的上一代旗舰产品E5 2699V4(22C44T,2.2Ghz)(系统是CentOS 7.4),于是乎,也算了一个,结果见帖子的最后的图和log文件,调用资源都为:%nproc=20,%mem=50gb

比较一番,发现:
1.Silver 4114在一些应该秒过的link(101,202,301等等)都停留时间巨长,大约都是30s左右,实际观察一下,在经过这些link的时候CPU占用率都是100%,也就是调用单核,只有L502和L703时,CPU占用 率才达到1900%-2000%之间,这应该也是其实际用时(10 min 54 s)和Elapsed time(3 min 53.2 s)差别巨大的原因吧,因此我怀疑这个CPU的调用有问题

2.E5 2699V4的实际用时(3 min 27 s)和 Elapsed time(3 min 25.2 s)差不多,也就是说,在整个计算期间,所有的核都是基本被全部调用的,实际上,计算的时候,CPU占用率一直是1900%-2000%

3.计算的时候的CPU频率,虽然二者的基频都是2.2GHz,但是E5 2699V4在计算时候,有睿频加成,实际的频率大概在2.6-2.8GHz左右,而Silver 4114只有极个别的Link(L502,L703,经其他测试,L1002也可以)频率能够接近2.2GHz,其余的Link,除了一个核之外,其他的都停留在最低的0.8GHz,这与查到的也不相符(10 Core Normal 2.5GHz, AVX2 2.2GHz,参考文献:https://en.wikichip.org/wiki/intel/xeon_silver/4114,这里也发现,E5-2699V4对不同的指令集,睿频机制没有差别,10Core都是是2.8GHz,参考文献:https://en.wikichip.org/wiki/intel/xeon_e5/e5-2699_v4),因此二者虽然基频相同,但是实际运行的频率是不同的,因此Elapsed time还是有差别的(Silver 4114  3 min 53.2 s   vs  E5 2699V4  3 min 25.2 s )

总的来说,这个结果让我很疑惑,Intel Scalable Silver 4114即使不更好,也不应该更差呀,特别是在实际计算当中的CPU并行调用情况,让我不解,不知各位大神有没有什么建议和评论。
这些天来,又经过多方排查,最终发现,可能是现在安装的系统CentOS 7.5的问题(具体是什么原因还未知),换了CentOS7.3,立马正常了。。。也就是说,CentOS7.5对于intel XEON Scalable系列有可能兼容性不好?不知道有没有其他的类似的情况,既然整好了,就放一波评测结果

Gaussian版本G16 B01, test0397.com

Silver 4114(4*16G内存) %nproc=20 %mem=50GB :3 min 47 s
E5-2699V4(4*32G内存) %nproc=20 %mem=50GB :3 min 27 s
E5-2699V4 (4*32G内存)%nproc=44 %mem=100GB:2 min 55 s
E5-2687WV4(4*32G内存) %nproc=20 %mem=50GB :3 min 20 s
E5-2687WV4(4*32G内存) %nproc=24 %mem=50GB :3 min 7s
E5-2687WV4(4*32G内存) %nproc=24 %mem=100GB :3 min 14s

E5-2667V4(4*16G内存) %nproc=16 %mem=50GB :3 min 44 s

发现Silver 4114和E5V4的一些中高端的CPU相比,似乎不弱了,不过手中的E5V4都是没有插满8条的,可能发挥会有折扣吧,总感觉手头的这些E5V4没有充分发挥性能。








Scalable Silver 4114 vs E5 2699V4.png (38.65 KB, 下载次数 Times of downloads: 104)

Scalable Silver 4114 vs E5 2699V4.png

4114-test0397.log

153.92 KB, 下载次数 Times of downloads: 3

4114 result

2699-test0397.log

153.74 KB, 下载次数 Times of downloads: 2

2699 result

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

24#
 楼主 Author| 发表于 Post on 2018-12-29 20:01:14 | 只看该作者 Only view this author
qchem 发表于 2018-12-29 17:16
我的是Gold 6149 CPU
用你的设置测了一下,link101这些都是秒过的
总的时间是2 minutes 41.3 seconds

CentOS 7.3,101这些也都是秒过的,而且CPU耗时和实际耗时相差不超过1秒,感觉并行性更好了。

202

帖子

0

威望

802

eV
积分
1004

Level 4 (黑子)

23#
发表于 Post on 2018-12-29 17:16:46 | 只看该作者 Only view this author
dreamyeye 发表于 2018-12-27 18:50
这些天来,又经过多方排查,最终发现,可能是现在安装的系统CentOS 7.5的问题(具体是什么原因还未知),换 ...

我的是Gold 6149 CPU
用你的设置测了一下,link101这些都是秒过的
总的时间是2 minutes 41.3 seconds

我的系统是CentOS 7.5
我现在就是感觉网络有问题,会卡

35

帖子

0

威望

119

eV
积分
154

Level 3 能力者

22#
发表于 Post on 2018-12-28 13:11:26 | 只看该作者 Only view this author
期待lz测试7.6的情况,感觉挺奇怪,为什么和操作系统有关系。

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

21#
 楼主 Author| 发表于 Post on 2018-12-28 11:54:47 | 只看该作者 Only view this author
highlight 发表于 2018-12-28 11:06
https://serverfault.com/question ... -and-other-newer-cp
监控一下不同系统版本的频率,会不会是kernel ...

现在已经更换了CentOS 7.3,之前CentOS 7.5的时候除了l502和l703,其他的那些link只有一个核达到基频,其他的只是停留在最小频率

185

帖子

1

威望

4133

eV
积分
4338

Level 6 (一方通行)

20#
发表于 Post on 2018-12-28 11:06:04 | 只看该作者 Only view this author
本帖最后由 highlight 于 2018-12-28 11:24 编辑

https://serverfault.com/question ... -and-other-newer-cp
监控一下不同系统版本的频率,会不会是kernel的问题呢?

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

19#
发表于 Post on 2018-12-28 01:49:23 | 只看该作者 Only view this author
dreamyeye 发表于 2018-12-27 18:50
这些天来,又经过多方排查,最终发现,可能是现在安装的系统CentOS 7.5的问题(具体是什么原因还未知),换 ...

可以试试CentOS 7.6
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

71

帖子

1

威望

369

eV
积分
460

Level 3 能力者

18#
发表于 Post on 2018-12-27 23:36:43 | 只看该作者 Only view this author
本帖最后由 Tanya 于 2018-12-27 23:42 编辑

还有这事!?幸好我偷懒, 装的就是CentOS 7.3。因为手头有一张以前刻录的7.3。装好后都没在线升级

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

17#
 楼主 Author| 发表于 Post on 2018-12-27 18:50:59 | 只看该作者 Only view this author
这些天来,又经过多方排查,最终发现,可能是现在安装的系统CentOS 7.5的问题(具体是什么原因还未知),换了CentOS7.3,立马正常了。。。也就是说,CentOS7.5对于intel XEON Scalable系列有可能兼容性不好?不知道有没有其他的类似的情况。一楼有具体的评测。

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

16#
 楼主 Author| 发表于 Post on 2018-12-26 21:48:59 | 只看该作者 Only view this author
本帖最后由 dreamyeye 于 2018-12-26 21:50 编辑
qchem 发表于 2018-12-26 21:20
赛扬时代就比较过,同样的主频,赛扬是没有奔腾快的。L2 cache起作用的
现在Intel各种牌之间肯定是有不 ...

其实这几天我又做了几波测试,包括和供货商沟通,让他们用4116也在同核数下测了一波,4116的各项数据就和2699比较接近,除了l502和l703基本都是秒过,而且测试还发现,对于当前的4114,随着内存从10G——20G——30G——40G——50G,计算是明显地越来越慢了,所以肯定还是有问题,还在进一步排查原因中

202

帖子

0

威望

802

eV
积分
1004

Level 4 (黑子)

15#
发表于 Post on 2018-12-26 21:20:38 | 只看该作者 Only view this author
dreamyeye 发表于 2018-12-23 20:39
是在同核心数的情况下比的,比如银牌4114有20个核,而2699也用20个核,用来比较是因为两款CPU的基频相同 ...

赛扬时代就比较过,同样的主频,赛扬是没有奔腾快的。L2 cache起作用的
现在Intel各种牌之间肯定是有不小差异的

41

帖子

0

威望

3874

eV
积分
3915

Level 5 (御坂)

14#
发表于 Post on 2018-12-24 22:44:27 | 只看该作者 Only view this author
dreamyeye 发表于 2018-12-24 19:41
6161是多少核啊?实际计算的时候调用了多少核核内存?

22核,我没注意呢,明天再测看一下。

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

13#
 楼主 Author| 发表于 Post on 2018-12-24 19:41:44 | 只看该作者 Only view this author
asdf 发表于 2018-12-24 17:25
双路6161测出来1m52.130s

6161是多少核啊?实际计算的时候调用了多少核核内存?

41

帖子

0

威望

3874

eV
积分
3915

Level 5 (御坂)

12#
发表于 Post on 2018-12-24 17:25:55 | 只看该作者 Only view this author
双路6161测出来1m52.130s

274

帖子

0

威望

4278

eV
积分
4552

Level 6 (一方通行)

11#
 楼主 Author| 发表于 Post on 2018-12-23 20:39:02 | 只看该作者 Only view this author
qchem 发表于 2018-12-23 20:10
你这个银牌怎么和2699V4比呀,金牌都比不过的

是在同核心数的情况下比的,比如银牌4114有20个核,而2699也用20个核,用来比较是因为两款CPU的基频相同,都是2.2GHz。手头也有比2699V4低的CPU,但是基频都更高,等我也比较一下,把结果放上来。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 19:07 , Processed in 0.214855 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list