计算化学公社

标题: 谈谈8581C这颗CPU性能 [打印本页]

作者
Author:
量化小王子    时间: 2025-2-17 19:39
标题: 谈谈8581C这颗CPU性能
本帖最后由 量化小王子 于 2025-2-19 09:46 编辑

     话说最近逛论坛,发现有人想配置8581C的双路服务器。同时在一些公众号上强力推荐英特尔8581C双路服务器,称之为脚踢7R32,拳打 9654,性能最强。本着是骡子是马拉出来遛遛的原则。利用一个CP2K几何优化的任务,测试了一下性能。当然由于本人财力有限,也不可能自己配台8581C服务器去测试,因此薅了一下天*智算云的羊毛,看到他们的服务器有8581C,所以测试了一下,本身免费送的核时只有1000小时,所以最后连完整的一步几何优化都没跑完,同时对比了一下目前使用的超算平台的性能以及论坛好心人@lwang2016 自用的9654单路服务器(感谢大哥帮我代算,十分感谢)性能。配置如下:天*智算云 双路8581C 内存DDR5 5600 32G*16  硬盘 未知 (CP2K 2025.1)测试核心 120 内存设为480GB。自用服务器 八路6132 内存 1.5T 硬盘未知 (2024.1) 测试核心 112 内存800GB  好心人lwang2016  单路9654 内存未知 硬盘未知 (CP2K 2022.1) 核心数好像是81(不确定),内存未知。
     测试结果如下:在自洽场收敛阶段 9654平均一圈耗时87秒左右排第一。接下来是八路6132 平均一圈耗时 110多秒 垫底的反而是8581C 平均一圈耗时210多秒。对于这个计算速度,反映给了天*智算云客服人员,最后也没解决这个问题。当然由于CP2K版本不一样,测试结果仅供参考,就是现在有个疑问,8581C 这个CPU性能本身就这么菜鸡还是超算平台设置有问题?希望给打算要配服务器的各位大神一个参考。输入文件以及部分输出会以附件添加,各位有兴趣的话,可以自己去测试一下。





作者
Author:
lwang2016    时间: 2025-2-17 20:04
我的AMD 9654单路服务器
硬盘是三星 SSD 2T M.2
内存是三星DDR5 Recc 32G 4800*12根

当时没有满核心计算可能是81核。

另外CP2K是直接下载了编译版 直接使用的,我自己不会编译安装。
作者
Author:
量化小王子    时间: 2025-2-17 20:26
lwang2016 发表于 2025-2-17 20:04
我的AMD 9654单路服务器
硬盘是三星 SSD 2T M.2
内存是三星DDR5 Recc 32G 4800*12根

感谢大哥,话说老哥你可以按照@冰释之川 这位大神的帖子给老爷机离线安装CP2K-2022.2的笔记
http://bbs.keinsci.com/forum.php ... 3&fromuid=35758
(出处: 计算化学公社)自己编译一下,我们用的账户就是我自己编译的
作者
Author:
tonganlhy    时间: 2025-2-17 21:19
9654看起来很能打呀心动了
作者
Author:
五十八    时间: 2025-2-17 23:23
本帖最后由 五十八 于 2025-2-17 23:25 编辑

我用的是论坛里的测试,我的配置一摸一样,而且内存4800,不过vasp650-edge版本rl 8的时候156s,rl9的时候还能更快一些,(不过也可能是软件原因,我是编译开了sysv的,不过毕竟是单个节点,所以只是两个cpu间的sysv,因为x13dei只有16个插槽,所以全插满
作者
Author:
小冷~715    时间: 2025-2-18 15:47
版本和编译的问题,双路8336是~124s,双路8475是~61s,在2022.2上跑的。如果删除keep space group F在7.1上跑,可以再提速4-5s。我去年国庆开始像你一样到处蹭机器,测过一些cp2k和vasp的算例。双路9654预计在46s左右,双路8581c预计在51s。我也在攒钱买机器准备做力场训练,不过我觉得集群的性价比更高一些。可能是大环境不好,我们这边一些运营商的机房租赁很便宜。最后提醒一下,楼主注意保护好自己隐私,out里面能看到用户名,小心超算机构找上门。
作者
Author:
量化小王子    时间: 2025-2-18 18:30
小冷~715 发表于 2025-2-18 15:47
版本和编译的问题,双路8336是~124s,双路8475是~61s,在2022.2上跑的。如果删除keep space group F在7.1上 ...

感谢提醒,我也觉得编译问题,因为使用的CP2K是超算结构提供的,我并没有自己编译
作者
Author:
enine    时间: 2025-2-19 09:09
8581都是马来货,主打一个性价比
作者
Author:
wangyj    时间: 2025-2-19 09:34
我用论坛里很火的那台双路7R32跑了一下,相同的81核,每一步的耗时在90S左右,和你测的单路9654差不多了,不过CP2K版本是2023.2,不知道会不会本身比你用的版本快一些。


作者
Author:
量化小王子    时间: 2025-2-19 09:39
enine 发表于 2025-2-19 09:09
8581都是马来货,主打一个性价比

不知道是超算自己编译的CP2K有问题还是8581C本就这么菜鸡?
作者
Author:
量化小王子    时间: 2025-2-19 09:40
wangyj 发表于 2025-2-19 09:34
我用论坛里很火的那台双路7R32跑了一下,相同的81核,每一步的耗时在90S左右,和你测的单路9654差不多了, ...

那说明双路7R32和单路9654跑CP2K性能差不多
作者
Author:
Santz    时间: 2025-2-19 10:20
我的 8481C 用 25 核,CP2K-2024.3,测试才 120s 左右。
  1. SCF WAVEFUNCTION OPTIMIZATION

  2.   Step     Update method      Time    Convergence         Total energy    Change
  3.   ------------------------------------------------------------------------------

  4. *** WARNING in fm/cp_fm_elpa.F:522 :: Setting real_kernel for ELPA failed ***

  5.      1 NoMix/Diag. 0.40E+00  113.2     0.98359240    -14205.0590464773 -1.42E+04

  6. *** WARNING in fm/cp_fm_elpa.F:522 :: Setting real_kernel for ELPA failed ***

  7.      2 Broy./Diag. 0.40E+00  120.6     0.39693870    -14026.3100992675  1.79E+02

  8. *** WARNING in fm/cp_fm_elpa.F:522 :: Setting real_kernel for ELPA failed ***

  9.      3 Broy./Diag. 0.40E+00  120.6     0.78411552    -14354.1295241889 -3.28E+02

  10. *** WARNING in fm/cp_fm_elpa.F:522 :: Setting real_kernel for ELPA failed ***

  11.      4 Broy./Diag. 0.40E+00  121.3     0.78998443    -14426.0460620968 -7.19E+01

  12. *** WARNING in fm/cp_fm_elpa.F:522 :: Setting real_kernel for ELPA failed ***
复制代码



作者
Author:
wangyj    时间: 2025-2-19 10:25
本帖最后由 wangyj 于 2025-2-19 10:47 编辑
Santz 发表于 2025-2-19 10:20
我的 8481C 用 25 核,CP2K-2024.3,测试才 120s 左右。

双路7R32用25核每一步在139S左右
作者
Author:
量化小王子    时间: 2025-2-19 10:50
wangyj 发表于 2025-2-19 10:25
你才用25核,这个速度很可以了吧

网上查不到8481c的性能跑分,但有类似双路8480和8488C的跑分在12万左右,双路7R32跑分在7万左右。就算8481C性能强,但也不至于25核心就这么快吧,感觉不可思议。在一个我看他的输出文件有错误警告,我不知道这个会不会影响,反正只是一个参考。
作者
Author:
Santz    时间: 2025-2-19 11:05
量化小王子 发表于 2025-2-19 10:50
网上查不到8481c的性能跑分,但有类似双路8480和8488C的跑分在12万左右,双路7R32跑分在7万左右。就算848 ...
*** WARNING in fm/cp_fm_elpa.F:522 :: Setting real_kernel for ELPA failed ***

这个报错没什么影响,该报错来自于ELPA_KERNEL 默认设置为AUTO,但是未正确识别到机器的kernel。参考 1 2,不会影响计算结果。在输入文件Global 部分添加PREFERRED_DIAG_LIBRARY SCALAPACK 或将 ELPA_KERNEL 更改为 GENERIC 或 GENERIC_SIMPLE可以避免
作者
Author:
量化小王子    时间: 2025-2-19 11:33
Santz 发表于 2025-2-19 11:05
这个报错没什么影响,该报错来自于ELPA_KERNEL 默认设置为AUTO,但是未正确识别到机器的kernel。参考 1 ...

学习到了
作者
Author:
chever    时间: 2025-2-19 11:46
量化小王子 发表于 2025-2-19 10:50
网上查不到8481c的性能跑分,但有类似双路8480和8488C的跑分在12万左右,双路7R32跑分在7万左右。就算848 ...

还有一个内存带宽因素,cp2k对内存带宽要求高,DDR5比DDR4还是要快不少的
作者
Author:
Santz    时间: 2025-2-19 17:41
补充一个 2*8383C=80 核,CP2K-2022.2 用时在 64s 左右。
  1. System Hardware Report - node5
  2. Generated: 2025-02-19 11:13:45

  3. ====== System Information ======
  4. Operating System: CentOS Linux release 7.9.2009 (Core)
  5. Kernel Version: 3.10.0-1160.el7.x86_64
  6. Architecture: x86_64
  7. System Uptime: up 3 weeks, 4 days, 9 hours, 27 minutes

  8. ====== Network Information ======
  9. Hostname: node5
  10. ...

  11. ====== Motherboard Information ======
  12. Manufacturer: Supermicro
  13. Product Name: X12DAi-N6
  14. Serial Number: NM229S005261

  15. ====== CPU Information ======
  16. Model: Intel(R) Xeon(R) Platinum 8383C CPU @ 2.70GHz
  17. Physical CPUs: 2
  18. Cores per CPU: 40
  19. Logical Cores: 80
  20. Hyper-Threading: Disabled

  21. ----------------------------------------------
  22. Filled memory slots: 16
  23. Total installed memory: 1024GiB

  24. Total memory slots: 16
  25. ==============================================

  26. ====== Memory Information ======
  27. Total Memory: 1007.35 GB
  28. Available Memory: 810.88 GB
  29. Total Swap: 4.00 GB
  30. Free Swap: 3.98 GB
  31. ...
复制代码



作者
Author:
kkk1167    时间: 2025-2-19 21:10
Santz 发表于 2025-2-19 17:41
补充一个 2*8383C=80 核,CP2K-2022.2 用时在 64s 左右。

看来3代铂金依然很能打
作者
Author:
doublezhang    时间: 2025-2-21 19:12
好多公号都卖这个
作者
Author:
量化小王子    时间: 2025-2-22 12:37
doublezhang 发表于 2025-2-21 19:12
好多公号都卖这个

就是,实际性能到底如何,谁也不知道
作者
Author:
alwens    时间: 2025-3-4 22:38
散热,内存都有影响。
作者
Author:
大王来何    时间: 2025-3-13 18:51
8581c 双路 45s左右
作者
Author:
量化小王子    时间: 2025-3-13 20:21
大王来何 发表于 2025-3-13 18:51
8581c 双路 45s左右

证明了8581C这个CPU还是能打的,只不过就是超算平台自己部署的软件有问题,没有发挥出它应该有的性能
作者
Author:
gog    时间: 2025-3-16 17:19
量化小王子 发表于 2025-3-13 20:21
证明了8581C这个CPU还是能打的,只不过就是超算平台自己部署的软件有问题,没有发挥出它应该有的性能

租超算用的,感觉是要亏了。自己买的机器上,调整优化参数,编译出高性能的软件。
作者
Author:
量化小王子    时间: 2025-3-18 17:42
gog 发表于 2025-3-16 17:19
租超算用的,感觉是要亏了。自己买的机器上,调整优化参数,编译出高性能的软件。

只是薅了一个羊毛
作者
Author:
aikeyin    时间: 2025-3-19 23:24
三代铂金8383C现在的性能还够用吗?比如跑CP2K的AIMD或QE的能带计算等操作。CPU升级太快了,六代的至强都要出来了啊。有没有大佬可以告知下啊,感谢了
作者
Author:
Qilin    时间: 2025-5-16 11:42
可以这样运行 CP2K 使用你的输入文件进行测试吗?
    export OMP_NUM_THREADS=24
    export PATH=${HOME}/softwares/cp2k-2025.1:${PATH}
    export CP2K_DATA_DIR=${HOME}/softwares/cp2k-2025.1/data
    ./cp2k-2025.1-Linux-gnu-x86_64.ssmp -i KQ.inp -o KQ.out





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3