计算化学公社

标题: Intel Gold 6149 test [打印本页]

作者
Author:
qchem    时间: 2018-5-22 19:51
标题: Intel Gold 6149 test

Gaussian带的0397例子
cpusbeginendtimecpus nproctime
g09
1
14:22:09
14:49:09
0:27:00
g16
1
42min2.9
2
14:49:09
15:02:54
0:13:45
2
21min3.8
4
15:04:41
15:11:49
0:07:08
4
10min56.7
8
15:11:49
15:15:37
0:03:48
8
5min49.2
16
14:19:56
14:22:09
0:02:13
16
3min20.2
32
15:02:54
15:04:41
0:01:47
32
2min35.6
36
14:09:13
14:10:51
0:01:38
36

双cpu,每cpu 16核,共64线程(超线程没关)
架构:           x86_64
CPU 运行模式:   32-bit, 64-bit
字节序:         Little Endian
CPU:             64
在线 CPU 列表:  0-63
每个核的线程数: 2
每个座的核数:   16
座:             2
NUMA 节点:      2
厂商 ID:        GenuineIntel
CPU 系列:       6
型号:           85
型号名称:       Intel(R) Xeon(R) Gold 6149 CPU @ 3.10GHz
步进:           4
CPU MHz:        3108.095
CPU 最大 MHz:   3101.0000
CPU 最小 MHz:   1200.0000
BogoMIPS:       6200.00
虚拟化:         VT-x
L1d 缓存:       32K
L1i 缓存:       32K
L2 缓存:        1024K
L3 缓存:        22528K
NUMA 节点0 CPU: 0-15,32-47
NUMA 节点1 CPU: 16-31,48-63

简单试了一下

对照
E5-2680 v3,24核
g09
4cpu,8min28s
8cpu, 4min39s
16cpu, 2min49s

24cpu, 2min46s


g16 big mem 用nproc
24cpu, 3min35.9s
16cpu, 4min8.1s
12cpu, 4min15.0s
8cpu, 7min20.4s
4cpu, 13min22.8s
g16 big mem sep cpu 用%cpu,间隔用
24cpu, 4min34.9s
16cpu, 5min4.8s
12cpu, 5min7.1s
8cpu, 7min17.1s
4cpu, 14min9.4s
g16 big mem con cpu 用%cpu,连续用
24cpu, 2min56.5s
16cpu, 4min8.7s
12cpu, 5min30.4s
8cpu, 7min33.1s

4cpu, 14min34.3s




作者
Author:
dreamyeye    时间: 2018-5-23 08:54
怎么感觉没什么优势呢?毕竟基频6149还明显高于2680的。
作者
Author:
sobereva    时间: 2018-5-23 13:02
很好的测试,省得老有人想着用gold
作者
Author:
一颗赛艇    时间: 2018-5-24 05:55
本帖最后由 一颗赛艇 于 2018-5-24 06:33 编辑

你这gold里面内存是怎么配置的?单条多大,频率多块,一共几条?

2680 v3 满载 2.9

Gold 6149 满载估计3.0,所以频率差得不是很大

这个测试应该看8核(满载频率)的,超过12核2680v3估计会有一点跨NUMA的开销。

8核g09,Gold 6149要3:48,2680 v3要4:39   Gold快22.36%

8核g16,Gold 6149要5:49,2680 v3要7:17   Gold快25.21%

理论性能比(只看频率的话)6149:2680v3 = (3.0*16)/(2.9*12) = 1.3793


32核g09,Gold 6149要1:47,24核2680 v3要2:46   Gold快55.14%

32核g16,Gold 6149要2:35,24核2680 v3要2:56   Gold快13.55%


Gold 6149快得还是比较明显的,g09在gold上面的并行效率比2680v3上面好得多。建议楼主把gold上面g16的测试再优化一下。
如果Gold 6149(15500)比2680 v3(6000)贵50%以下的话,还是值得买的。

所以,结论是:去买2696 v3 !!!


作者
Author:
qchem    时间: 2018-5-26 19:42
一颗赛艇 发表于 2018-5-24 05:55
你这gold里面内存是怎么配置的?单条多大,频率多块,一共几条?

2680 v3 满载 2.9

内存是8*8G,DDR4 2400的
我发现它就只会工作在3.1的频率上,没有睿频。所以速度上不去,确实Gold没有想像中那么快。
作者
Author:
alwens    时间: 2018-5-28 21:26
我刚入手一台gold 6151  参数和6152 一样

过几天跑跑测试看看
作者
Author:
nk9999    时间: 2018-6-10 14:03
请问楼主测试是使用的发行二进制版本的高斯吗?  有没有试过从源码加-xCORE-AVX512 后缀进行AVX512优化编译的结果呢?
作者
Author:
kyuu    时间: 2018-6-12 11:27
nk9999 发表于 2018-6-10 14:03
请问楼主测试是使用的发行二进制版本的高斯吗?  有没有试过从源码加-xCORE-AVX512 后缀进行AVX512优化编译 ...

这位同学,第一高斯没出过AVX512版本,第二你确定你能弄到源码?
作者
Author:
nk9999    时间: 2018-6-14 08:48
kyuu 发表于 2018-6-12 11:27
这位同学,第一高斯没出过AVX512版本,第二你确定你能弄到源码?

在帖子http://bbs.keinsci.com/thread-9855-1-1.html中,往后看id 为五十八的老师的帖子,源码一般是没有的,但是也不是绝对搞不到。。我自己做高斯做的少,过一段时间新的平台到位了,我会在你之前说闲的蛋疼的帖子里更新VASP的在金牌系统下AVX-512的架构加成系数。
作者
Author:
喵星大佬    时间: 2021-11-9 17:16
本帖最后由 喵星大佬 于 2021-11-9 17:58 编辑

再补充点数据,11800H,g16测0397,8核的情况
win11,WSL里linux AVX2版,5min16s
win11,win版,19min24swin11, win版,开超线程16线,13min17s





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3