计算化学公社
标题: Intel Gold 6149 test [打印本页]
作者Author: qchem 时间: 2018-5-22 19:51
标题: Intel Gold 6149 test
Gaussian带的0397例子 | cpus | begin | end | time | | | cpus nproc | time |
g09 | 1 | 14:22:09 | 14:49:09 | 0:27:00 | | g16 | 1 | 42min2.9 |
| 2 | 14:49:09 | 15:02:54 | 0:13:45 | | | 2 | 21min3.8 |
| 4 | 15:04:41 | 15:11:49 | 0:07:08 | | | 4 | 10min56.7 |
| 8 | 15:11:49 | 15:15:37 | 0:03:48 | | | 8 | 5min49.2 |
| 16 | 14:19:56 | 14:22:09 | 0:02:13 | | | 16 | 3min20.2 |
| 32 | 15:02:54 | 15:04:41 | 0:01:47 | | | 32 | 2min35.6 |
| 36 | 14:09:13 | 14:10:51 | 0:01:38 | | | 36 | |
双cpu,每cpu 16核,共64线程(超线程没关)
架构: x86_64
CPU 运行模式: 32-bit, 64-bit
字节序: Little Endian
CPU: 64
在线 CPU 列表: 0-63
每个核的线程数: 2
每个座的核数: 16
座: 2
NUMA 节点: 2
厂商 ID: GenuineIntel
CPU 系列: 6
型号: 85
型号名称: Intel(R) Xeon(R) Gold 6149 CPU @ 3.10GHz
步进: 4
CPU MHz: 3108.095
CPU 最大 MHz: 3101.0000
CPU 最小 MHz: 1200.0000
BogoMIPS: 6200.00
虚拟化: VT-x
L1d 缓存: 32K
L1i 缓存: 32K
L2 缓存: 1024K
L3 缓存: 22528K
NUMA 节点0 CPU: 0-15,32-47
NUMA 节点1 CPU: 16-31,48-63
简单试了一下
对照
E5-2680 v3,24核
g09
4cpu,8min28s
8cpu, 4min39s
16cpu, 2min49s
24cpu, 2min46s
g16 big mem 用nproc
24cpu, 3min35.9s
16cpu, 4min8.1s
12cpu, 4min15.0s
8cpu, 7min20.4s
4cpu, 13min22.8s
g16 big mem sep cpu 用%cpu,间隔用
24cpu, 4min34.9s
16cpu, 5min4.8s
12cpu, 5min7.1s
8cpu, 7min17.1s
4cpu, 14min9.4s
g16 big mem con cpu 用%cpu,连续用
24cpu, 2min56.5s
16cpu, 4min8.7s
12cpu, 5min30.4s
8cpu, 7min33.1s
4cpu, 14min34.3s
作者Author: dreamyeye 时间: 2018-5-23 08:54
怎么感觉没什么优势呢?毕竟基频6149还明显高于2680的。
作者Author: sobereva 时间: 2018-5-23 13:02
很好的测试,省得老有人想着用gold
作者Author: 一颗赛艇 时间: 2018-5-24 05:55
本帖最后由 一颗赛艇 于 2018-5-24 06:33 编辑
你这gold里面内存是怎么配置的?单条多大,频率多块,一共几条?
2680 v3 满载 2.9
Gold 6149 满载估计3.0,所以频率差得不是很大
这个测试应该看8核(满载频率)的,超过12核2680v3估计会有一点跨NUMA的开销。
8核g09,Gold 6149要3:48,2680 v3要4:39 Gold快22.36%
8核g16,Gold 6149要5:49,2680 v3要7:17 Gold快25.21%
理论性能比(只看频率的话)6149:2680v3 = (3.0*16)/(2.9*12) = 1.3793
32核g09,Gold 6149要1:47,24核2680 v3要2:46 Gold快55.14%
32核g16,Gold 6149要2:35,24核2680 v3要2:56 Gold快13.55%
Gold 6149快得还是比较明显的,g09在gold上面的并行效率比2680v3上面好得多。建议楼主把gold上面g16的测试再优化一下。
如果Gold 6149(15500)比2680 v3(6000)贵50%以下的话,还是值得买的。
所以,结论是:去买2696 v3 !!!
作者Author: qchem 时间: 2018-5-26 19:42
内存是8*8G,DDR4 2400的
我发现它就只会工作在3.1的频率上,没有睿频。所以速度上不去,确实Gold没有想像中那么快。
作者Author: alwens 时间: 2018-5-28 21:26
我刚入手一台gold 6151 参数和6152 一样
过几天跑跑测试看看
作者Author: nk9999 时间: 2018-6-10 14:03
请问楼主测试是使用的发行二进制版本的高斯吗? 有没有试过从源码加-xCORE-AVX512 后缀进行AVX512优化编译的结果呢?
作者Author: kyuu 时间: 2018-6-12 11:27
这位同学,第一高斯没出过AVX512版本,第二你确定你能弄到源码?
作者Author: nk9999 时间: 2018-6-14 08:48
在帖子http://bbs.keinsci.com/thread-9855-1-1.html中,往后看id 为五十八的老师的帖子,源码一般是没有的,但是也不是绝对搞不到。。我自己做高斯做的少,过一段时间新的平台到位了,我会在你之前说闲的蛋疼的帖子里更新VASP的在金牌系统下AVX-512的架构加成系数。
作者Author: 喵星大佬 时间: 2021-11-9 17:16
本帖最后由 喵星大佬 于 2021-11-9 17:58 编辑
再补充点数据,11800H,g16测0397,8核的情况
win11,WSL里linux AVX2版,5min16s
win11,win版,19min24swin11, win版,开超线程16线,13min17s
欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |