计算化学公社

标题: G16在多平台上性能实测(慢更)(916更新8/4并行算力) [打印本页]

作者
Author:
biogon    时间: 2020-9-14 22:36
标题: G16在多平台上性能实测(慢更)(916更新8/4并行算力)
本帖最后由 biogon 于 2020-9-16 17:57 编辑

测试软件:G16A03 AVX2版本

测试任务和脚本:
Gaussian Test397,关键词是:#p rb3lyp/3-21g force test scf=novaracc脚本为@ggdh 所提供
耗时均为avx2下测试
数据可以和http://bbs.keinsci.com/thread-19256-1-1.html 帖子中相比较

测试平台1:
双路Gold 6254
DDR4 2400 768G
ubuntu 18.04LTS 内核版本5.3
测试平台2:
双路E5 2650 V3
DDR4 2133 64G
Cent os 7.4 内核版本3.1
测试平台3:
单路Gold 6150
DDR4 2400 96G
Cent os 7.4 内核版本3.1
任务耗时(s)
(, 下载次数 Times of downloads: 42)
分析:可以看出6254和6150在使用核心数较少时的差距纯粹由于两代之间0.2GHz主频差距导致的微小耗时差距,核心多时由于AVX2加速频率差异变大导致了耗时的差距进一步的拉大,e5v3就由于挤了这么多年牙膏还是可堪一用的,其它的就没什么好说的了(更新添加了power)

8核、4核任务并行耗时(s)
(, 下载次数 Times of downloads: 36)
分析:可以看出使用核心数越少并行数越多效率是越高的,6150多核能力相比6254在这里体现出了显著的差距
未完待续









作者
Author:
ggdh    时间: 2020-9-15 22:43
大佬方便的话测一下4核算力,方便不同平台之间比较
后面我也把我的单任务并行效率放到这里和你的这个比一比
作者
Author:
biogon    时间: 2020-9-15 23:58
ggdh 发表于 2020-9-15 22:43
大佬方便的话测一下4核算力,方便不同平台之间比较
后面我也把我的单任务并行效率放到这里和你的这个比一 ...

好,明天就更新8 4核算力
作者
Author:
biogon    时间: 2020-9-16 18:05
ggdh 发表于 2020-9-15 22:43
大佬方便的话测一下4核算力,方便不同平台之间比较
后面我也把我的单任务并行效率放到这里和你的这个比一 ...

我发现这个某些耗时再跑一次没有差别是因为用了之前的数据?
作者
Author:
ggdh    时间: 2020-9-16 18:58
biogon 发表于 2020-9-16 18:05
我发现这个某些耗时再跑一次没有差别是因为用了之前的数据?

对 如果当前目录里面已经跑过某些个设置(核数和任务数)的数据,那会自动读取,你要重跑,可以新建目录跑

作者
Author:
biogon    时间: 2020-9-16 19:35
ggdh 发表于 2020-9-16 18:58
对 如果当前目录里面已经跑过某些个设置(核数和任务数)的数据,那会自动读取,你要重跑,可以新建目录跑 ...

哦对,发现了这个了,等后面机器闲了再跑那些
作者
Author:
ggdh    时间: 2020-9-16 19:50
(, 下载次数 Times of downloads: 44)
感觉gold还是亏啊。6254 最大算力没有8175M好,还比8175M贵

作者
Author:
biogon    时间: 2020-9-16 19:54
ggdh 发表于 2020-9-16 19:50
感觉gold还是亏啊。6254 最大算力没有8175M好,还比8175M贵

应该频率还是上不去,AVX2频率能高到3.7的,现在3.5都上不去
作者
Author:
ggdh    时间: 2020-9-16 20:04
本帖最后由 ggdh 于 2020-9-16 20:49 编辑

(, 下载次数 Times of downloads: 42)
单个Gaussian 任务,在不同CPU上的并行效率。
讨论:
1. Gaussian 在不同的平台上并行效率不一样,这个我初步估计应该是Intel和AMD的睿频策略不同,以及内存通道数限制导致(后面做详细讨论。
2. 在使用核数不多的情况,单任务增加核心的并行效率,和固定单任务核心数,而增加任务数的并行效率的趋势是定性一致的。(和上面的图对比看)
3. 对于EPYC 7742,在核心数达到64以后,计算耗时基本上没有发生改变。可能是任务太小了,还有待进一步测试
4. 3970X和3990X 确实不适合跑Gaussian
5. 单看intel的几款,不由感叹牙膏挤的之均匀。。。
6. Risen 确实涨的快,但是落得也快。。。还是epic史诗更持久,amd起名还是有讲究的。。






作者
Author:
啦啦黑还黑    时间: 2020-9-17 00:54
ggdh 发表于 2020-9-16 20:04
单个Gaussian 任务,在不同CPU上的并行效率。
讨论:
1. Gaussian 在不同的平台上并行效率不一样,这个 ...

你说的第三条,7742我在测试vasp的时候也有类似现象。用64核以上基本速度提升不大,这几天打算试试cp2k,这个并行表现可能比vasp好
作者
Author:
biogon    时间: 2020-9-17 08:36
ggdh 发表于 2020-9-16 20:04
单个Gaussian 任务,在不同CPU上的并行效率。
讨论:
1. Gaussian 在不同的平台上并行效率不一样,这个 ...

我感觉可以在大规模并行的软件比如NWChem上试试7742看看表现如何
作者
Author:
biogon    时间: 2020-9-17 08:37
啦啦黑还黑 发表于 2020-9-17 00:54
你说的第三条,7742我在测试vasp的时候也有类似现象。用64核以上基本速度提升不大,这几天打算试试cp2k, ...

vasp用的ICC编译的吗,我倒是觉得可以试试amd的AOCC
作者
Author:
biogon    时间: 2020-9-23 10:30
佳友小鱼 发表于 2020-9-23 09:43
如果3990x是因为内存通道的因素,那么不知道intel平台是不是也会受到影响。

可以考虑做一个intel平台单 ...

非常大,这个已经有人测过了,4通道相比6通道损失有20%
作者
Author:
OIrH    时间: 2021-9-28 23:06
想看3970x和3990x的pro版:3975wx和3995wx的测评,内存开到8通道了。
作者
Author:
biogon    时间: 2022-1-25 10:21
OIrH 发表于 2021-9-28 23:06
想看3970x和3990x的pro版:3975wx和3995wx的测评,内存开到8通道了。

你就当他是频率更高的7542和7742就行了,这个没啥好测的,双路不好搞




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3