计算化学公社

标题: 几颗不同处理器跑同一任务耗时比较 [打印本页]

作者
Author:
MirrirFlower    时间: 2026-3-31 15:04
标题: 几颗不同处理器跑同一任务耗时比较
本帖最后由 MirrirFlower 于 2026-4-30 14:47 编辑

最近把用的几颗处理器用Gaussian跑同一个任务,比较几颗不同处理器的耗时,结果如下 表所示。
由于几台电脑并非由我完全掌控,因此做不到完全同一,有的跑win,有的跑了一两个月没关机,有的超频了,因此结果仅供参考。
计算任务是优化+频率分析,结果以优化过程耗时,输出文件的Job cpu time和Elapsed time为参考。Gaussian版本为16.A03.AVX2,核心通过【%nprocshared=】指定物理核心数,内存同一给到30GB,输入文件可以参考附件。
从计算耗时来说新出的270k Plus最短,不愧是新出的旗舰处理器。让我比较意外的是14900k打不过245k,不知道是不是因为14900k的超线程发力了还是这一代大小核不行抑或是其他原因导致的。这几颗处理器中245K意外的还不错。双路E5-2696V4之前测试中发现使用22核心计算耗时比44核心快不少,这里就直接使用22核心进行计算。7840H也额外被我拉进来凑个数23333。
也欢迎各位大佬下载附件用自己的机器测试一下数据。
--------------------------------
4月2号更新,谢谢 @exity ,@wbqdssl ,@Rowena 大佬们提供的测试数据, 加入到表格中,顺便把频率分析数据补充上了。
--------------------------------
4月25号更新,谢谢@Rowena,@Monsoon,@zhouoh大佬们提供的测试数据。
--------------------------------
4月30号更新,谢谢@Satoru提供的测试数据。
重新整理了数据表格,删除文章表格,附上数据的excel文件。
数据来自本帖相关楼层和相关连接,如有记录错误可联系楼主进行更正。

(, 下载次数 Times of downloads: 111)




作者
Author:
MirrirFlower    时间: 2026-3-31 15:34
喔对了,刚注意到,opt关键词有gdiis,cartesian应该就不生效了(没记错的话),我这边写关键词忘记删了,关键词写的有些臃肿,大家别介意啊。
作者
Author:
goldNAN    时间: 2026-4-1 17:02
跟9950x 比起来怎么样

作者
Author:
exity    时间: 2026-4-2 09:08
本帖最后由 exity 于 2026-4-2 10:32 编辑

我稍后贡献一个9950X3D的数据,先占个楼。
配置是9950X3D+64GB内存
OS: Rocky Linux 10.0 (Red Quartz)
内存:DDR5 32GB*2 6400


几何优化耗时如下
Job cpu time:       0 days  1 hours 58 minutes 50.4 seconds.
Elapsed time:       0 days  0 hours  7 minutes 30.0 seconds.


振动分析耗时如下
Job cpu time:       0 days  0 hours 14 minutes 22.4 seconds.
Elapsed time:       0 days  0 hours  0 minutes 54.5 seconds.


其余详情见out文件。
噫?几百K的out文件不让上传?


作者
Author:
guoguoping199    时间: 2026-4-2 09:15
exity 发表于 2026-4-2 09:08
我稍后贡献一个9950X3D的数据,先占个楼。

坐等大佬数据,最近在纠结是买9950x还是9950x3d,看最新的AMD发布9950x3d2了,不知道大缓存对计算的速度影响有多大
作者
Author:
exity    时间: 2026-4-2 09:20
guoguoping199 发表于 2026-4-2 09:15
坐等大佬数据,最近在纠结是买9950x还是9950x3d,看最新的AMD发布9950x3d2了,不知道大缓存对计算的速度 ...

实测9950X3D比7950X快很多。9950X我没有,无法对比,心理感觉上带3D的要快上个20%左右。
作者
Author:
tonganlhy    时间: 2026-4-2 09:39
guoguoping199 发表于 2026-4-2 09:15
坐等大佬数据,最近在纠结是买9950x还是9950x3d,看最新的AMD发布9950x3d2了,不知道大缓存对计算的速度 ...

不差钱就上9950x3d2,差钱就9950X
作者
Author:
MirrirFlower    时间: 2026-4-2 10:19
exity 发表于 2026-4-2 09:08
我稍后贡献一个9950X3D的数据,先占个楼。
配置是9950X3D+64GB内存

谢谢 exity 大佬提供的9950x3d测试数据,我已将其更新在测试数据表格中,方便大家参考
作者
Author:
wbqdssl    时间: 2026-4-2 10:26
本帖最后由 wbqdssl 于 2026-4-2 16:51 编辑

9950X DDR5-6000-96G RockyLinux 9.7 功耗墙200W 没开EXPO
几何优化:
Job cpu time:       0 days  3 hours 28 minutes  2.3 seconds.
Elapsed time:       0 days  0 hours 13 minutes  5.4 seconds.

振动分析:
Job cpu time:       0 days  0 hours 24 minutes 19.5 seconds.
Elapsed time:       0 days  0 hours  1 minutes 31.9 seconds.
(, 下载次数 Times of downloads: 5)

作者
Author:
Rowena    时间: 2026-4-2 10:48
本帖最后由 Rowena 于 2026-4-2 10:50 编辑

9950X  DDR5-6000-28GB  ubuntu24.04  PBO2 负压25 功耗墙250W 温度墙85
几何优化
Job cpu time:       0 days  2 hours 20 minutes 10.3 seconds.
Elapsed time:       0 days  0 hours  9 minutes  5.3 seconds.
振动
Job cpu time:       0 days  0 hours 17 minutes  9.5 seconds.
Elapsed time:       0 days  0 hours  1 minutes  6.0 seconds.
作者
Author:
MirrirFlower    时间: 2026-4-2 11:21
wbqdssl 发表于 2026-4-2 10:26
9950X DDR5-6000-96G RockyLinux 9.7 功耗墙200W
几何优化:
Job cpu time:       0 days  3 hours 28 m ...

谢谢 wbqdssl 大佬提供的9950x测试数据,稍后将其更新在测试数据表格中,方便大家参考。从文件输出结果看使用的内存大小似乎是30GB
作者
Author:
MirrirFlower    时间: 2026-4-2 11:22
Rowena 发表于 2026-4-2 10:48
9950X  DDR5-6000-28GB  ubuntu24.04  PBO2 负压25 功耗墙250W 温度墙85
几何优化
Job cpu time:        ...

谢谢 Rowena 大佬提供的9950x测试数据,稍后将其更新在测试数据表格中,方便大家参考。
作者
Author:
exity    时间: 2026-4-2 13:58
两个9950X怎么差这么多?EXPO没开?
作者
Author:
fwz3888    时间: 2026-4-2 14:55
非常好的测试,270K PLUS表现超出预期。后续如果有不同大小的体系大家一起测试会很有帮助。
作者
Author:
tonganlhy    时间: 2026-4-2 15:12
fwz3888 发表于 2026-4-2 14:55
非常好的测试,270K PLUS表现超出预期。后续如果有不同大小的体系大家一起测试会很有帮助。

270K plus内存频率高占了很大优势
作者
Author:
wbqdssl    时间: 2026-4-2 16:43
本帖最后由 wbqdssl 于 2026-4-2 16:52 编辑
exity 发表于 2026-4-2 13:58
两个9950X怎么差这么多?EXPO没开?


@MirrirFlower 楼主可以标注一下

作者
Author:
fwz3888    时间: 2026-4-2 17:10
tonganlhy 发表于 2026-4-2 15:12
270K plus内存频率高占了很大优势

这个体系很小,理论上来说内存带宽的影响应该不会特别大。比较好奇的是E-core没有太拖后腿
作者
Author:
tonganlhy    时间: 2026-4-2 20:58
fwz3888 发表于 2026-4-2 17:10
这个体系很小,理论上来说内存带宽的影响应该不会特别大。比较好奇的是E-core没有太拖后腿

E-core性能在285K上就已经有很大提升了。内存带宽的影响比你想象得要大。B站上还有视频,gaussian计算9950X默频被285K吊打。
作者
Author:
tonganlhy    时间: 2026-4-2 20:59
fwz3888 发表于 2026-4-2 17:10
这个体系很小,理论上来说内存带宽的影响应该不会特别大。比较好奇的是E-core没有太拖后腿

另外你看lz的统计,9950X一不小心就被14900K追上了。
作者
Author:
Rowena    时间: 2026-4-23 19:47
换了9950x3d2 负压30
几何优化:
Job cpu time:       0 days  1 hours 44 minutes 56.8 seconds.
Elapsed time:       0 days  0 hours  6 minutes 52.5 seconds.
振动分析:
Job cpu time:       0 days  0 hours 11 minutes 29.6 seconds.
Elapsed time:       0 days  0 hours  0 minutes 44.7 seconds.
作者
Author:
Rowena    时间: 2026-4-23 20:43
本帖最后由 Rowena 于 2026-4-27 13:42 编辑

ORCA 6.0.1 Cr2(AcO)4
TPSSh/def2-TZVP opt+freq

9950X:Timings for individual modules:

Sum of individual times          ...     1825.454 sec (=  30.424 min)
Startup calculation              ...       34.755 sec (=   0.579 min)   1.9 %
SCF iterations                   ...      680.733 sec (=  11.346 min)  37.3 %
Property integrals               ...      228.489 sec (=   3.808 min)  12.5 %
SCF Response                     ...      435.038 sec (=   7.251 min)  23.8 %
Property calculations            ...      177.911 sec (=   2.965 min)   9.7 %
SCF Gradient evaluation          ...      268.167 sec (=   4.469 min)  14.7 %
Geometry relaxation              ...        0.361 sec (=   0.006 min)   0.0 %
                             ****ORCA TERMINATED NORMALLY****
TOTAL RUN TIME: 0 days 0 hours 30 minutes 28 seconds 866 msec

9950X3D2
Timings for individual modules:

Sum of individual times          ...     1609.685 sec (=  26.828 min)
Startup calculation              ...       32.021 sec (=   0.534 min)   2.0 %
SCF iterations                   ...      630.205 sec (=  10.503 min)  39.2 %
Property integrals               ...      161.903 sec (=   2.698 min)  10.1 %
SCF Response                     ...      354.370 sec (=   5.906 min)  22.0 %
Property calculations            ...      171.341 sec (=   2.856 min)  10.6 %
SCF Gradient evaluation          ...      259.477 sec (=   4.325 min)  16.1 %
Geometry relaxation              ...        0.368 sec (=   0.006 min)   0.0 %
                             ****ORCA TERMINATED NORMALLY****
TOTAL RUN TIME: 0 days 0 hours 26 minutes 53 seconds 28 msec


对比9950x 9950x3d2 scf和梯度计算提升6%左右
没有什么显著优势
主要性能提升在hessian计算的部分
XC derivative integrals性能甚至翻倍
帖子中的测试提升大可能是因为用了很多的recalc



作者
Author:
fwz3888    时间: 2026-4-23 23:39
Rowena 发表于 2026-4-23 20:43
ORCA 6.0.1 Cr2(AcO)4
TPSSh/def2-TZVP opt+freq
文件传不上去

看上去提升不值价格啊 倒是9950X3D现在显得有性价比一些
作者
Author:
Monsoon    时间: 2026-4-24 01:04
9950x的数据前面几位大佬都已经测试的很全面了,补一个下位9700x的数据吧

9700X 8核 WSL2下Ubuntu 24.04 DDR5-6000-48GB(测试调用30GB) PBO2 负压20+功率墙105W
几何优化:
Job cpu time:       0 days  2 hours  6 minutes 10.8 seconds.
Elapsed time:       0 days  0 hours 15 minutes 49.6 seconds.
频率:
Job cpu time:       0 days  0 hours 15 minutes 20.4 seconds.
Elapsed time:       0 days  0 hours  1 minutes 55.4 seconds.

这个成绩挺意外的,已经非常接近9950X不开PBO的状态了,结合9700X在游戏方面(X3D下第一U)的显著优势,非常适合做个人主机兼顾日常工作娱乐和特殊情况下计算应急,当然如果是纯计算的话,最新的270K PLUS确实是显著优势了
作者
Author:
zhouoh    时间: 2026-4-25 12:30
补充一下我这里7950X3D的数据,默频使用没有开PBO

Ubuntu 22.04 DDR5-6000MT-30GB

几何优化:
Job cpu time:       0 days  2 hours 27 minutes 43.3 seconds.
Elapsed time:       0 days  0 hours  9 minutes 18.9 seconds.
振动分析:
Job cpu time:       0 days  0 hours 16 minutes 51.8 seconds.
Elapsed time:       0 days  0 hours  1 minutes  3.7 seconds.

作者
Author:
Satoru    时间: 2026-4-30 06:56
本帖最后由 Satoru 于 2026-4-30 01:59 编辑

9950X3D2 (CO: all core -18)/DDR5 6000c36 256GB
Opt:
Job cpu time:       0 days  1 hours 53 minutes 36.3 seconds.
Elapsed time:       0 days  0 hours  7 minutes 30.1 seconds.

Freq:
Job cpu time:       0 days  0 hours 12 minutes 16.0 seconds.
Elapsed time:       0 days  0 hours  0 minutes 48.0 seconds.


9950X (Boost +200 MHz; CO: ccd0 -12, ccd1 -20; CS:mf-mt -10, mf-ht -10, hf-mt -15, hf-ht -15)/DDR5 6400c32 64GB
Opt:
Job cpu time:       0 days  2 hours 18 minutes 23.9 seconds.
Elapsed time:       0 days  0 hours  9 minutes  3.8 seconds.

Freq:
Job cpu time:       0 days  0 hours 16 minutes 47.3 seconds.
Elapsed time:       0 days  0 hours  1 minutes  5.0 seconds.


AI Max+ 395/LPDDR5X 8000 128G
Opt:
Job cpu time:       0 days  2 hours  1 minutes 13.7 seconds.
Elapsed time:       0 days  0 hours  8 minutes  2.9 seconds.

Freq:
Job cpu time:       0 days  0 hours 14 minutes 11.6 seconds.
Elapsed time:       0 days  0 hours  0 minutes 55.9 seconds.


都关超线程,用16核30G计算;系统均为Fedora43
刚发现题主用的A03...以上都是C02的数据


作者
Author:
Rowena    时间: 2026-5-1 05:53
本帖最后由 Rowena 于 2026-5-1 09:29 编辑
Satoru 发表于 2026-4-30 06:56
9950X3D2 (CO: all core -18)/DDR5 6000c36 256GB
Opt:
Job cpu time:       0 days  1 hours 53 minute ...

MSI B850 EDGE TI,全核【-40】或者【-30基础上继续分核对齐】都只能跑分,重载就冻屏,就停在-30用了
分别屏蔽CCD进一步测试
CCD0可能是因为要冲高频加上本来就电压低,全核-30可以稳定,分核给金银核以外加一点负压就不稳了。
ORCA实乃烤鸡神器,不稳的情况下Cinebench26,AIDA64烤FPU都可以过,但是ORCA一提交就冻屏
CCD1倒是-40都无所谓


作者
Author:
Satoru    时间: 2026-5-1 15:44
本帖最后由 Satoru 于 2026-5-1 03:47 编辑
Rowena 发表于 2026-4-30 17:53
MSI B850 EDGE TI,全核【-40】或者【-30基础上继续分核对齐】都只能跑分,重载就冻屏,就停在-30用了
...

感觉我摸到雷了主板x870E tomahawk,全核-25提交orca就死机,-20跑任务中途死机,-18目前稳定。目测两个ccd频率差不多,我暂时也不在乎单核性能,就没分ccd/分核调

我的感觉是高斯压力比orca大,之前有的设置orca能跑高斯就会死
作者
Author:
Rowena    时间: 2026-5-1 17:19
Satoru 发表于 2026-5-1 15:44
感觉我摸到雷了主板x870E tomahawk,全核-25提交orca就死机,-20跑任务中途死机,-18目前稳定。 ...

不一定雷,X3D2设计上两个CCD不一样,CCD0最大5650MHz,CCD1最大5450MHz,重载下会一起同步到5350-5250的样子。负压少可能是默认给的电压就低,我的CCD0默认下就比CCD1跑同频率低0.1 V,也没有CCD1能降压,全核-30情况下CCD0还是比CCD1低0.1 V。网上不是说SDT定最大5225,看电压在1.25 V以下都属于正常体质




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3