计算化学公社

 找回密码 Forget password
 注册 Register

几颗不同处理器跑同一任务耗时比较

查看数: 1207 | 评论数: 27 | 收藏 Add to favorites 2
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2026-3-31 15:04

正文摘要:

本帖最后由 MirrirFlower 于 2026-4-30 14:47 编辑 最近把用的几颗处理器用Gaussian跑同一个任务,比较几颗不同处理器的耗时,结果如下 表所示。 由于几台电脑并非由我完全掌控,因此做不到完全同一,有的跑win ...

回复 Reply

Rowena 发表于 Post on yesterday 17:19
Satoru 发表于 2026-5-1 15:44
感觉我摸到雷了主板x870E tomahawk,全核-25提交orca就死机,-20跑任务中途死机,-18目前稳定。 ...

不一定雷,X3D2设计上两个CCD不一样,CCD0最大5650MHz,CCD1最大5450MHz,重载下会一起同步到5350-5250的样子。负压少可能是默认给的电压就低,我的CCD0默认下就比CCD1跑同频率低0.1 V,也没有CCD1能降压,全核-30情况下CCD0还是比CCD1低0.1 V。网上不是说SDT定最大5225,看电压在1.25 V以下都属于正常体质
Satoru 发表于 Post on yesterday 15:44
本帖最后由 Satoru 于 2026-5-1 03:47 编辑
Rowena 发表于 2026-4-30 17:53
MSI B850 EDGE TI,全核【-40】或者【-30基础上继续分核对齐】都只能跑分,重载就冻屏,就停在-30用了
...

感觉我摸到雷了主板x870E tomahawk,全核-25提交orca就死机,-20跑任务中途死机,-18目前稳定。目测两个ccd频率差不多,我暂时也不在乎单核性能,就没分ccd/分核调

我的感觉是高斯压力比orca大,之前有的设置orca能跑高斯就会死
Rowena 发表于 Post on yesterday 05:53
本帖最后由 Rowena 于 2026-5-1 09:29 编辑
Satoru 发表于 2026-4-30 06:56
9950X3D2 (CO: all core -18)/DDR5 6000c36 256GB
Opt:
Job cpu time:       0 days  1 hours 53 minute ...

MSI B850 EDGE TI,全核【-40】或者【-30基础上继续分核对齐】都只能跑分,重载就冻屏,就停在-30用了
分别屏蔽CCD进一步测试
CCD0可能是因为要冲高频加上本来就电压低,全核-30可以稳定,分核给金银核以外加一点负压就不稳了。
ORCA实乃烤鸡神器,不稳的情况下Cinebench26,AIDA64烤FPU都可以过,但是ORCA一提交就冻屏
CCD1倒是-40都无所谓

Satoru 发表于 Post on 前天 06:56
本帖最后由 Satoru 于 2026-4-30 01:59 编辑

9950X3D2 (CO: all core -18)/DDR5 6000c36 256GB
Opt:
Job cpu time:       0 days  1 hours 53 minutes 36.3 seconds.
Elapsed time:       0 days  0 hours  7 minutes 30.1 seconds.

Freq:
Job cpu time:       0 days  0 hours 12 minutes 16.0 seconds.
Elapsed time:       0 days  0 hours  0 minutes 48.0 seconds.


9950X (Boost +200 MHz; CO: ccd0 -12, ccd1 -20; CS:mf-mt -10, mf-ht -10, hf-mt -15, hf-ht -15)/DDR5 6400c32 64GB
Opt:
Job cpu time:       0 days  2 hours 18 minutes 23.9 seconds.
Elapsed time:       0 days  0 hours  9 minutes  3.8 seconds.

Freq:
Job cpu time:       0 days  0 hours 16 minutes 47.3 seconds.
Elapsed time:       0 days  0 hours  1 minutes  5.0 seconds.


AI Max+ 395/LPDDR5X 8000 128G
Opt:
Job cpu time:       0 days  2 hours  1 minutes 13.7 seconds.
Elapsed time:       0 days  0 hours  8 minutes  2.9 seconds.

Freq:
Job cpu time:       0 days  0 hours 14 minutes 11.6 seconds.
Elapsed time:       0 days  0 hours  0 minutes 55.9 seconds.


都关超线程,用16核30G计算;系统均为Fedora43
刚发现题主用的A03...以上都是C02的数据

评分 Rate

参与人数
Participants 2
eV +10 收起 理由
Reason
Rowena + 5 MSI B850 EDGE TI,-40和-30基础上继续分核.
MirrirFlower + 5 感谢大佬的测试数据,已更新汇入表格中

查看全部评分 View all ratings

zhouoh 发表于 Post on 7 day ago
补充一下我这里7950X3D的数据,默频使用没有开PBO

Ubuntu 22.04 DDR5-6000MT-30GB

几何优化:
Job cpu time:       0 days  2 hours 27 minutes 43.3 seconds.
Elapsed time:       0 days  0 hours  9 minutes 18.9 seconds.
振动分析:
Job cpu time:       0 days  0 hours 16 minutes 51.8 seconds.
Elapsed time:       0 days  0 hours  1 minutes  3.7 seconds.

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
MirrirFlower + 5 谢谢大佬带来的7950x3D的测试数据,已在原.

查看全部评分 View all ratings

Monsoon 发表于 Post on 2026-4-24 01:04:37
9950x的数据前面几位大佬都已经测试的很全面了,补一个下位9700x的数据吧

9700X 8核 WSL2下Ubuntu 24.04 DDR5-6000-48GB(测试调用30GB) PBO2 负压20+功率墙105W
几何优化:
Job cpu time:       0 days  2 hours  6 minutes 10.8 seconds.
Elapsed time:       0 days  0 hours 15 minutes 49.6 seconds.
频率:
Job cpu time:       0 days  0 hours 15 minutes 20.4 seconds.
Elapsed time:       0 days  0 hours  1 minutes 55.4 seconds.

这个成绩挺意外的,已经非常接近9950X不开PBO的状态了,结合9700X在游戏方面(X3D下第一U)的显著优势,非常适合做个人主机兼顾日常工作娱乐和特殊情况下计算应急,当然如果是纯计算的话,最新的270K PLUS确实是显著优势了

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
MirrirFlower + 5 谢谢大佬带来9700x的测试,稍后会更新上去

查看全部评分 View all ratings

fwz3888 发表于 Post on 2026-4-23 23:39:19
Rowena 发表于 2026-4-23 20:43
ORCA 6.0.1 Cr2(AcO)4
TPSSh/def2-TZVP opt+freq
文件传不上去

看上去提升不值价格啊 倒是9950X3D现在显得有性价比一些
Rowena 发表于 Post on 2026-4-23 20:43:26
本帖最后由 Rowena 于 2026-4-27 13:42 编辑

ORCA 6.0.1 Cr2(AcO)4
TPSSh/def2-TZVP opt+freq

9950X:Timings for individual modules:

Sum of individual times          ...     1825.454 sec (=  30.424 min)
Startup calculation              ...       34.755 sec (=   0.579 min)   1.9 %
SCF iterations                   ...      680.733 sec (=  11.346 min)  37.3 %
Property integrals               ...      228.489 sec (=   3.808 min)  12.5 %
SCF Response                     ...      435.038 sec (=   7.251 min)  23.8 %
Property calculations            ...      177.911 sec (=   2.965 min)   9.7 %
SCF Gradient evaluation          ...      268.167 sec (=   4.469 min)  14.7 %
Geometry relaxation              ...        0.361 sec (=   0.006 min)   0.0 %
                             ****ORCA TERMINATED NORMALLY****
TOTAL RUN TIME: 0 days 0 hours 30 minutes 28 seconds 866 msec

9950X3D2
Timings for individual modules:

Sum of individual times          ...     1609.685 sec (=  26.828 min)
Startup calculation              ...       32.021 sec (=   0.534 min)   2.0 %
SCF iterations                   ...      630.205 sec (=  10.503 min)  39.2 %
Property integrals               ...      161.903 sec (=   2.698 min)  10.1 %
SCF Response                     ...      354.370 sec (=   5.906 min)  22.0 %
Property calculations            ...      171.341 sec (=   2.856 min)  10.6 %
SCF Gradient evaluation          ...      259.477 sec (=   4.325 min)  16.1 %
Geometry relaxation              ...        0.368 sec (=   0.006 min)   0.0 %
                             ****ORCA TERMINATED NORMALLY****
TOTAL RUN TIME: 0 days 0 hours 26 minutes 53 seconds 28 msec


对比9950x 9950x3d2 scf和梯度计算提升6%左右
没有什么显著优势
主要性能提升在hessian计算的部分
XC derivative integrals性能甚至翻倍
帖子中的测试提升大可能是因为用了很多的recalc


评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
fwz3888 + 5 第一手数据!

查看全部评分 View all ratings

Rowena 发表于 Post on 2026-4-23 19:47:51
换了9950x3d2 负压30
几何优化:
Job cpu time:       0 days  1 hours 44 minutes 56.8 seconds.
Elapsed time:       0 days  0 hours  6 minutes 52.5 seconds.
振动分析:
Job cpu time:       0 days  0 hours 11 minutes 29.6 seconds.
Elapsed time:       0 days  0 hours  0 minutes 44.7 seconds.

评分 Rate

参与人数
Participants 2
eV +8 收起 理由
Reason
Satoru + 3 求问主板...我负压20跑高斯就死机了
MirrirFlower + 5 谢谢大佬带来9950x3d2的测试,稍后会更新上.

查看全部评分 View all ratings

tonganlhy 发表于 Post on 2026-4-2 20:59:50
fwz3888 发表于 2026-4-2 17:10
这个体系很小,理论上来说内存带宽的影响应该不会特别大。比较好奇的是E-core没有太拖后腿

另外你看lz的统计,9950X一不小心就被14900K追上了。
tonganlhy 发表于 Post on 2026-4-2 20:58:34
fwz3888 发表于 2026-4-2 17:10
这个体系很小,理论上来说内存带宽的影响应该不会特别大。比较好奇的是E-core没有太拖后腿

E-core性能在285K上就已经有很大提升了。内存带宽的影响比你想象得要大。B站上还有视频,gaussian计算9950X默频被285K吊打。
fwz3888 发表于 Post on 2026-4-2 17:10:32
tonganlhy 发表于 2026-4-2 15:12
270K plus内存频率高占了很大优势

这个体系很小,理论上来说内存带宽的影响应该不会特别大。比较好奇的是E-core没有太拖后腿
wbqdssl 发表于 Post on 2026-4-2 16:43:54
本帖最后由 wbqdssl 于 2026-4-2 16:52 编辑
exity 发表于 2026-4-2 13:58
两个9950X怎么差这么多?EXPO没开?


@MirrirFlower 楼主可以标注一下
tonganlhy 发表于 Post on 2026-4-2 15:12:42
fwz3888 发表于 2026-4-2 14:55
非常好的测试,270K PLUS表现超出预期。后续如果有不同大小的体系大家一起测试会很有帮助。

270K plus内存频率高占了很大优势

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-5-2 00:04 , Processed in 0.395306 second(s), 27 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list