请选择 进入手机版 | 继续访问电脑版
第13届北京科音初级量子化学培训班将于10月5~8日于北京举办,请点击此链接查看详情。这是新人一次性正确、完整学习量子化学计算的最好、最快机会,能少走无数弯路,欢迎参加并相互转告!(已报满)

计算化学公社

 找回密码
 现在注册!
查看: 368|回复: 11

[硬件评测] G16在多平台上性能实测(慢更)(916更新8/4并行算力)

[复制链接]

424

帖子

0

威望

1149

eV
积分
1573

Level 5 (御坂)

发表于 5 天前 | 显示全部楼层 |阅读模式
本帖最后由 biogon 于 2020-9-16 17:57 编辑

测试软件:G16A03 AVX2版本

测试任务和脚本:
Gaussian Test397,关键词是:#p rb3lyp/3-21g force test scf=novaracc脚本为@ggdh 所提供
耗时均为avx2下测试
数据可以和http://bbs.keinsci.com/thread-19256-1-1.html 帖子中相比较

测试平台1:
双路Gold 6254
DDR4 2400 768G
ubuntu 18.04LTS 内核版本5.3
测试平台2:
双路E5 2650 V3
DDR4 2133 64G
Cent os 7.4 内核版本3.1
测试平台3:
单路Gold 6150
DDR4 2400 96G
Cent os 7.4 内核版本3.1
任务耗时(s)
$CU(XW2R2CVURWWFL)I%L[U.png
分析:可以看出6254和6150在使用核心数较少时的差距纯粹由于两代之间0.2GHz主频差距导致的微小耗时差距,核心多时由于AVX2加速频率差异变大导致了耗时的差距进一步的拉大,e5v3就由于挤了这么多年牙膏还是可堪一用的,其它的就没什么好说的了(更新添加了power)

8核、4核任务并行耗时(s)
QQ截图20200916175700.png
分析:可以看出使用核心数越少并行数越多效率是越高的,6150多核能力相比6254在这里体现出了显著的差距
未完待续








评分

参与人数 2eV +10 收起 理由
ggdh + 5 期待更新
sobereva + 5

查看全部评分

667

帖子

19

威望

2795

eV
积分
3842

Level 5 (御坂)

发表于 3 天前 | 显示全部楼层
本帖最后由 ggdh 于 2020-9-16 20:49 编辑

single.png
单个Gaussian 任务,在不同CPU上的并行效率。
讨论:
1. Gaussian 在不同的平台上并行效率不一样,这个我初步估计应该是Intel和AMD的睿频策略不同,以及内存通道数限制导致(后面做详细讨论。
2. 在使用核数不多的情况,单任务增加核心的并行效率,和固定单任务核心数,而增加任务数的并行效率的趋势是定性一致的。(和上面的图对比看)
3. 对于EPYC 7742,在核心数达到64以后,计算耗时基本上没有发生改变。可能是任务太小了,还有待进一步测试
4. 3970X和3990X 确实不适合跑Gaussian
5. 单看intel的几款,不由感叹牙膏挤的之均匀。。。
6. Risen 确实涨的快,但是落得也快。。。还是epic史诗更持久,amd起名还是有讲究的。。





评分

参与人数 1eV +5 收起 理由
biogon + 5 GJ!

查看全部评分

667

帖子

19

威望

2795

eV
积分
3842

Level 5 (御坂)

发表于 4 天前 | 显示全部楼层
大佬方便的话测一下4核算力,方便不同平台之间比较
后面我也把我的单任务并行效率放到这里和你的这个比一比

424

帖子

0

威望

1149

eV
积分
1573

Level 5 (御坂)

 楼主| 发表于 4 天前 | 显示全部楼层
ggdh 发表于 2020-9-15 22:43
大佬方便的话测一下4核算力,方便不同平台之间比较
后面我也把我的单任务并行效率放到这里和你的这个比一 ...

好,明天就更新8 4核算力

424

帖子

0

威望

1149

eV
积分
1573

Level 5 (御坂)

 楼主| 发表于 3 天前 | 显示全部楼层
ggdh 发表于 2020-9-15 22:43
大佬方便的话测一下4核算力,方便不同平台之间比较
后面我也把我的单任务并行效率放到这里和你的这个比一 ...

我发现这个某些耗时再跑一次没有差别是因为用了之前的数据?

667

帖子

19

威望

2795

eV
积分
3842

Level 5 (御坂)

发表于 3 天前 | 显示全部楼层
biogon 发表于 2020-9-16 18:05
我发现这个某些耗时再跑一次没有差别是因为用了之前的数据?

对 如果当前目录里面已经跑过某些个设置(核数和任务数)的数据,那会自动读取,你要重跑,可以新建目录跑

424

帖子

0

威望

1149

eV
积分
1573

Level 5 (御坂)

 楼主| 发表于 3 天前 | 显示全部楼层
ggdh 发表于 2020-9-16 18:58
对 如果当前目录里面已经跑过某些个设置(核数和任务数)的数据,那会自动读取,你要重跑,可以新建目录跑 ...

哦对,发现了这个了,等后面机器闲了再跑那些

667

帖子

19

威望

2795

eV
积分
3842

Level 5 (御坂)

发表于 3 天前 | 显示全部楼层
new.png
感觉gold还是亏啊。6254 最大算力没有8175M好,还比8175M贵

424

帖子

0

威望

1149

eV
积分
1573

Level 5 (御坂)

 楼主| 发表于 3 天前 | 显示全部楼层
ggdh 发表于 2020-9-16 19:50
感觉gold还是亏啊。6254 最大算力没有8175M好,还比8175M贵

应该频率还是上不去,AVX2频率能高到3.7的,现在3.5都上不去

101

帖子

2

威望

1128

eV
积分
1269

Level 4 (黑子)

发表于 前天 00:54 | 显示全部楼层
ggdh 发表于 2020-9-16 20:04
单个Gaussian 任务,在不同CPU上的并行效率。
讨论:
1. Gaussian 在不同的平台上并行效率不一样,这个 ...

你说的第三条,7742我在测试vasp的时候也有类似现象。用64核以上基本速度提升不大,这几天打算试试cp2k,这个并行表现可能比vasp好

424

帖子

0

威望

1149

eV
积分
1573

Level 5 (御坂)

 楼主| 发表于 前天 08:36 | 显示全部楼层
ggdh 发表于 2020-9-16 20:04
单个Gaussian 任务,在不同CPU上的并行效率。
讨论:
1. Gaussian 在不同的平台上并行效率不一样,这个 ...

我感觉可以在大规模并行的软件比如NWChem上试试7742看看表现如何

424

帖子

0

威望

1149

eV
积分
1573

Level 5 (御坂)

 楼主| 发表于 前天 08:37 | 显示全部楼层
啦啦黑还黑 发表于 2020-9-17 00:54
你说的第三条,7742我在测试vasp的时候也有类似现象。用64核以上基本速度提升不大,这几天打算试试cp2k, ...

vasp用的ICC编译的吗,我倒是觉得可以试试amd的AOCC
您需要登录后才可以回帖 登录 | 现在注册!

本版积分规则

手机版|北京科音自然科学研究中心|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949-1号 )

GMT+8, 2020-9-19 07:11 , Processed in 0.168942 second(s), 30 queries .

快速回复 返回顶部 返回列表