计算化学公社

标题: 【12.5更新9654对比】4189/4677平台测试版cpu vasp算力测评 [打印本页]

作者
Author:
frontleg    时间: 2024-11-13 19:40
标题: 【12.5更新9654对比】4189/4677平台测试版cpu vasp算力测评
本帖最后由 frontleg 于 2024-12-5 19:38 编辑

几年前无意间看到了论坛的神贴“统一解答关于2066/3647平台正式版/es/qs cpu稳定性的疑问”,测试版超高的性价比,使本实验室从此走上了测试版的不归路,几年下来,测试版cpu稳定性经受住了考验。随着Intel的更新迭代,3647一代神U QQ87(8280不显,步进5)已经跟不上进度,后续4189,4677平台测试结果分享给大家。

1. 4189平台
从这代开始,超威等主板魔改bios无法刷入,故无法简单通过添加微码的方式使超威主板支持早期步进(步进<=5)的es cpu(超威早期bios支持步进5,但不能升级bios,超威x12主板不支持bios降级),导致步进5的cpu目前白菜价,可选用技嘉MD72-HB3、国鑫G3DE-B等主板。目前性价比高的是36核 QVM7(步进5,感谢fantexi113指正)淘宝价格700左右,配上8通道3200ddr4的cpu,vasp计算时间大约为双路QQ87 70%,考虑到QVM7核数比QQ87多30%,两者vasp计算单核效率相近。如考虑性价比,3647平台比4189还是要实惠很多。

2.4677平台
四代志强可扩展的步进涵盖12345678。市场上有大量步进1,2的cpu,QVV5,QY36等,目前没有主板可以点亮。步进4-8的cpu任意主板均能点亮,价格较贵。目前比较合适的为步进3的cpu,支持技嘉MS73-HB1主板,支持ddr5内存,内存带宽更高。步进3顶配cpu为60核QYFX,TDP350W,价位相对高一些,2500左右。其他TDP 350Wcpu包括56核QYFX,QYFS,52核QYFV,48核QYG6(基频2.5G,比56核高一些),价格都在1000-1500左右。实测上述双路350W TDP (包括正式版8481c) cpu vasp计算速度几乎相同,约为4路QQ87(合计112核)计算时间的80%,单核效率提升约20%,功耗比4路QQ87低不少。

================
2024.11.21 更新
不能发新帖了,应要求把vasp测试的具体算力分享给大家,
1. vasp5.4.4 + intel 编译器2018 update 3 计算的结果,注意要打开nostopcar选项。测试为负载型金属纳米线,同一个起始几何结构测试10个几何步,看总计算时间。
2. vasp6单电子部步计算会稍快,但vasp6 scf收敛步数会增加,导致测试结果会增加。
3. 关于测试版cpu的稳定性,vasp计算测试下来没有任何问题,包括“统一解答关于2066/3647平台正式版/es/qs cpu稳定性的疑问”原贴中诟病的低步进cpu(3647平台步进2,QL1F、QL1K、QL1L等),计算效率稍低,但胜在价格特别便宜。
================
2024.12.1 更新
1. 每一代cpu功耗都在上升,4677平台双路vasp满载大概1000w,4189平台大概800w,3647平台大概600w,大量装机也要考虑功耗和散热
2. intel cpu故障率比nVidia显卡低不少

cpu型号@基频             总物理核心数         平台     TDP     内存频率   内存通道数    10个几何步vasp计算总时间      
双路8481C                     112                  4677    350      ddr5-4800     8                  223s
双路QYFR/QYFS@1.9G    112                 4677     350      ddr5-4800     8                 217s
双路QYCM@1.8G            112                   4677     350     ddr5-4800     8                 228s
双路QYFV@2.0G             104                   4677     350     ddr5-4800     8                 219s
双路QYG6@2.5G              96                   4677     350     ddr5-4800     8                 220s
双路8375C@2.9G             64                   4189     300     ddr4-3200     8                 390s
双路QVM7@2.2G              72                   4189     300     ddr4-3200     8                 360s
双路8273CL@2.2G            56                   3647     165     ddr4-2666     6                 503s
双路QQ87@2.5G             56                   3647      205     ddr4-2666     6                 486s
四路QQ87@2.5G             112                   3647      205     ddr4-2666     6                 262s
四路8163@2.5G             96                   3647      165     ddr4-2666     6                  310s
双路8173M@2.0G             56                   3647     165     ddr4-2666     6                 534s
双路8124M@2.0G             36                   3647     240     ddr4-2666     6                 582s
双路P8124@2.0G             36                   3647     240     ddr4-2666     6                  609s
双路QL1F@1.8G             56                   3647     165     ddr4-2666     6                 572s
双路QL1L@1.8G             40                   3647     165     ddr4-2666     6                 895s
双路QLNS@2.6G             40                   3647     240     ddr4-2666     6                 665s
双路QL1K@1.8G             48                   3647     165     ddr4-2666     6                 662s
双路2696v4@2.2G           44                  2011-3   150     ddr4-2400     4                 923s
双路2698Rv4@2.3G           40                  2011-3   135     ddr4-2400     4                906s
双路2673v4@2.3G           40                  2011-3   135      ddr4-2400     4                907s
双路2696v3@2.3G           36                  2011-3   145    ddr4-2133     4                1052s
双路2670@2.6G              16                 2011      115    ddr3-1600?     4?              2511s

单路9654                       96                  SP5        360w        ddr5-4800?       12        368s


作者
Author:
fantexi113    时间: 2024-11-14 08:17
4189平台,超微x12,官方1.1固件是可以支持步进5的。是QVM7,不是QYM7。4189更推荐步进6的QWAT,价格1000左右,适配性更好些,板子基本都支持
作者
Author:
frontleg    时间: 2024-11-14 08:34
fantexi113 发表于 2024-11-14 08:17
4189平台,超微x12,官方1.1固件是可以支持步进5的。是QVM7,不是QYM7。4189更推荐步进6的QWAT,价格1000左 ...

笔误,谢谢指出
作者
Author:
frontleg    时间: 2024-11-26 11:10
更新了测试任务,大家有对比的机型的也可以反馈给我
作者
Author:
fantexi113    时间: 2024-11-28 07:52
真详细,谢谢楼主。超微的x12dai我试过bmc降bios版本,没问题,目前就用的x12dai装了两颗qvm7,vasp是装的641,用的oneapi编译的,后面有时间也测试下
作者
Author:
Entropy.S.I    时间: 2024-11-28 17:10
本帖最后由 Entropy.S.I 于 2024-11-28 17:13 编辑

INCAR未作任何调整,在我们实验室的HPC上申请1组4x V100-SXM2-16G (NVLink Full-mesh互联),由slurm自动分配并绑定12个4GHz Zen3 CPU核心(硬件价格<2万元),CPU启用SMT,OMP_NUM_THREADS=6,VASP 6.4.2 & NVHPC 24.3(no-MPI) & OpenMPI 5.0.5,测得Elapsed time = 239.7s,速度接近112核心的2*8481C + 16-Ch DDR5 4800MT/s
作者
Author:
beyondstar    时间: 2024-12-1 07:25
Entropy.S.I 发表于 2024-11-28 17:10
INCAR未作任何调整,在我们实验室的HPC上申请1组4x V100-SXM2-16G (NVLink Full-mesh互联),由slurm自动分 ...

求联系方式
作者
Author:
frontleg    时间: 2024-12-1 17:53
fantexi113 发表于 2024-11-28 07:52
真详细,谢谢楼主。超微的x12dai我试过bmc降bios版本,没问题,目前就用的x12dai装了两颗qvm7,vasp是装的6 ...

vasp6单电子部步计算会稍快,但vasp6 scf收敛步数会增加,导致测试结果会增加。

作者
Author:
kkk1167    时间: 2024-12-1 20:41
本帖最后由 kkk1167 于 2025-1-2 09:26 编辑

看看情况
作者
Author:
beyondstar    时间: 2024-12-4 07:53
Entropy.S.I 发表于 2024-11-28 17:10
INCAR未作任何调整,在我们实验室的HPC上申请1组4x V100-SXM2-16G (NVLink Full-mesh互联),由slurm自动分 ...

求联系方式,打算弄一个
作者
Author:
bblovelp    时间: 2024-12-4 23:38
使用步进3的CPU会不会出现VASP计算重启这种问题啊。
作者
Author:
frontleg    时间: 2024-12-5 08:20
bblovelp 发表于 2024-12-4 23:38
使用步进3的CPU会不会出现VASP计算重启这种问题啊。

使用下来没有问题
作者
Author:
bblovelp    时间: 2024-12-5 16:40
本帖最后由 bblovelp 于 2024-12-5 16:45 编辑
frontleg 发表于 2024-12-5 08:20
使用下来没有问题

好的,谢谢啦。还有CPU 350 TDP,主板MOS管温度怎么样,我手上一台8375CES的塔式服务器,有一个主板MOS管温度跑48个核就能到100°附近、
作者
Author:
frontleg    时间: 2024-12-5 18:41
bblovelp 发表于 2024-12-5 16:40
好的,谢谢啦。还有CPU 350 TDP,主板MOS管温度怎么样,我手上一台8375CES的塔式服务器,有一个主板MOS管 ...

国鑫这个主板还好,用了1年多MOS管没出过任何问题,这个主板上没有显示mos温度。
作者
Author:
bblovelp    时间: 2024-12-6 15:10
frontleg 发表于 2024-12-5 18:41
国鑫这个主板还好,用了1年多MOS管没出过任何问题,这个主板上没有显示mos温度。

好的。谢谢了
作者
Author:
frontleg    时间: 2024-12-23 16:22
bblovelp 发表于 2024-12-6 15:10
好的。谢谢了

不放心可以加个小风扇对着吹,肯定温度就下来了
作者
Author:
sunlin3685    时间: 2024-12-25 16:31
多核心的平台,或者说特别多的核心平台,关键在优化多核心;
作者
Author:
五十八    时间: 2024-12-27 20:48
cpu是 主板是 x13DEI, vasp650 edge版本,8581C *2 120 cores 没开SMT, oneapi 2023 ,ifx编译218s, ifort编译213s,如果使用ov/of的话会更快一些,只有156s emmm
作者
Author:
frontleg    时间: 2025-1-1 19:17
五十八 发表于 2024-12-27 20:48
cpu是 主板是 x13DEI, vasp650 edge版本,8581C *2 120 cores 没开SMT, oneapi 2023 ,ifx编译218s, ifo ...


作者
Author:
Picardo    时间: 2025-1-3 22:24
感觉后面3代志强会成为垃圾佬的主力
作者
Author:
frontleg    时间: 2025-1-10 12:13
Picardo 发表于 2025-1-3 22:24
感觉后面3代志强会成为垃圾佬的主力

三代一下就过渡过去了,不知道量大不大
作者
Author:
五十八    时间: 2025-2-17 11:17
frontleg 发表于 2025-1-1 19:17

更新到RL9.1之后,变成了152.376s
作者
Author:
doublezhang    时间: 2025-2-21 19:13
7b13 ×2 128核 ddr4 2666 rocky8.10 250s
作者
Author:
frontleg    时间: 2025-4-25 20:03
doublezhang 发表于 2025-2-21 19:13
7b13 ×2 128核 ddr4 2666 rocky8.10 250s


作者
Author:
bowen111    时间: 2025-6-20 20:20
doublezhang 发表于 2025-2-21 19:13
7b13 ×2 128核 ddr4 2666 rocky8.10 250s

麻烦问下怎么编译的啊,我这边7B13跑起来巨慢
作者
Author:
lzhhao    时间: 2025-7-15 18:15
9654这么慢吗
作者
Author:
frontleg    时间: 2025-7-16 09:01
lzhhao 发表于 2025-7-15 18:15
9654这么慢吗

vasp还是需要intel的U




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3