【求助】可扩展系列处理器的架构效率测试

nk9999 · 发表于 Post on 2018-6-10 14:22:41

各位老师好。最近我所在的组里可能要采购一批服务器做VASP计算，经过我的初步调研，有一个问题有困惑，希望已经用上可扩展系列处理器的老师能给解答。

问题概述：希望知道可扩展系列处理器的ipc效率（或称之为架构加成系数，定义见测试方法）比V4系列强多少，比V2系列又强多少(可选，主要用于和天河2租赁机时比较性价比)。

问题来源：采购的时候需要计算V4处理器和可扩展处理器的性价比区别，因此需要先估算其实际软件性能，这不得不涉及到ipc效率的区别。因为如果ipc都一样，显然V4的处理器性价比更高，而如果可扩展处理器的ipc效率更高，则有可能可扩展处理器有更高的性价比。

测试方法：

现定义单个处理器的总性能估算如下：Performance per CPU=Cores*Full load frenquency*ipc coefficient ，其中Cores是处理器的核心数，Fullload frenquency是处理器的满载睿频频率，ipc coefficient即ipc效率，现规定V3 V4系统的ipc效率系数为1。测试软件最好使用VASP。需要注意的是，VASP需要在编译的时候加入-xCORE-AVX512 来启用AVX-512指令集优化，不然将得到与V4接近的ipc效率。编译可参考帖子（http://bbs.keinsci.com/thread-5743-1-1.html）, 为了减少软件并行损失的问题，希望都使用合理的npar值。测试使用相同的VASP版本跑相同的测试文件。设在可扩展处理器系统上下使用c1个核心跑的时间为t1，可扩展处理器系统的满载频率为f1；在V4系统上使用c2个核心跑的时间为t2，V4系统的满载频率为f2.则可扩展处理器的ipc系数为 (t2*f2*c2)/(t1*f1*c1)。与V2系统的对比同理。

附：

Ipc效率差别的来源：主要有两方面，其一是不同代的cpu的微架构的区别，导致轻微的效率差距，其二是新的指令集的引入使得ipc效率发生很大变化，例如V1 V2 系列的CPU只有AVX指令集， V3 V4系列的CPU有AVX2指令集，而可扩展处理器则有AVX-512指令集。这三者在执行可矢量化的密集型浮点运算的时候理论性能是依次翻倍的。论坛里（http://bbs.keinsci.com/thread-9855-1-1.html）有不少人说ipc效率和V4的一样，这可能来源于他们并没有打开AVX-512的编译优化，而有一位老师（id五十八）则提到使用AVX-512正确编译的VASP的ipc效率可以相比于V4系统有大幅提升，根据他给出的信息，其一，四路6140系统是双路2697v3系统的6倍，则可以计算出ipc效率系数为2.26（算法参考上面公式），这里面定义V3 V4系统的ipc效率倍率为1.0。其二，单路6140轻松干掉双路2697v3，则可以估算ipc效率系数为1.5. 因为id五十八老师给出的信息比较笼统，因此只能估算出ipc系数正确编译之后应该大于1.5，但是具体是多少还需要详细的测试。@五十八

另，如果不得不使用Gaussian测试，可能直接拿到的二进制发行版并没有AVX-512优化，需要拿到源码加入-xCORE-AVX512重新编译才能正确发挥可扩展处理器系统的能力。

希望各位老师能不吝赐教，能给出一个AVX-512编译后的VASP的ipc效率系数，这样也可以给买了至强可扩展处理器的其他老师一些帮助。谢谢。

kyuu · 发表于 Post on 2018-6-12 11:20:23

闲的蛋疼

nk9999 · 发表于 Post on 2018-6-12 18:03:06

kyuu 发表于 2018-6-12 11:20
闲的蛋疼

为何？测试可扩展处理器的架构加成系数难道没意义？

binarec · 发表于 Post on 2018-6-17 22:38:27

你这个测试没太多意义
首先要确认软件对AVX512指令集有没有特殊优化，用同一个编译版本的软件来比较其运行效率有可能不能得到架构效率的直接比较，不同软件给出的效率提升也并不相同。AVX、AVX2、AVX512指令集对浮点运算的速率并不是简单的依次翻倍关系，具体可以去看看intel的技术文档
其次不同代cpu，支持的内存频率、延迟，以及UPI/QPI带宽等等也不一样，不能简单比较效率
再次就算是同一款cpu，普通满载频率，AVX2满载频率和AVX512满载频率都是不一样的，而且这个似乎intel没有给出官方的值
这些问题的存在，就决定了不能简单定义ipc来衡量新架构效率提升

nk9999 · 发表于 Post on 2018-6-18 13:44:58

binarec 发表于 2018-6-17 22:38
你这个测试没太多意义
首先要确认软件对AVX512指令集有没有特殊优化，用同一个编译版本的软件来比较其运行 ...

ok,既然都觉得没必要那就不测了。。

（其实是我发现GPU更有性价比）。。

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register

[硬件评测] 【求助】可扩展系列处理器的架构效率测试

评分 Rate

浏览过的版块