|
本帖最后由 pika02 于 2020-3-8 00:20 编辑
之前看ggdh发的帖子提到了g09运算速度和主频之间的关系,基本上呈线性。那么g16和orca的计算速度和cpu主频之间又是怎样的关系呢?又忍不住折腾了一番。
测试环境:
硬件:CPU为3950X 16核(bios中将主频锁死),B450芯片组,双通道DDR4 3200 32GB*2。
软件:Linux Mint 19.3,g16 A.03 AVX2(环境变量中添加了PGI_FASTMATH_CPU=sandybridge防止报错),orca 4.2.1,OpenMPI 3.1.4。
输入文件是这里给的vomilenine,做opt,全部设为16核,16GB内存。
orca使用关键词为opt B3LYP/G 6-31G(d) tightscf noautostart miniprint nopop grid4 nofinalgrid(用“猫她芬”生成的)。
由于两个程序使用的具体参数不完全一致,二者耗时没有可比性,本文不涉及两个程序之间的效率对比。
一图流:
相对计算速度为该软件在3.9 GHz下的耗时除以某频率下的耗时。
可以看到,在2.5-3.9的主频范围内,两个软件的相对计算速度均与CPU主频呈线性关系。
但是,CPU的主频超过某个拐点后,功耗并不和主频呈线性关系,而是大大增加。比如我这颗3950x(事先设置了-0.0875 V的offset),将插槽总功耗(PPT)限制在71W下时,跑g16能达到3.9-4.0 GHz;而解开PPT限制后,PPT能随手达到130W,而频率仅提升了0.1-0.2 GHz。
不管是i家还是A家,主流的高性能桌面CPU都有自动超频的功能,A家的还往往超过拐点,代价就是大幅提升功耗。对于使用PC跑计算的用户,CPU功耗越大,发热越厉害,硅脂寿命就越短,风扇(假设有温控)就越吵,而且电费就越高。
如果你嫌你的PC跑计算时又热又吵,建议手动设置一个功耗墙或温度墙(许多家用机主板bios都支持),当计算任务重时自动降频,在小幅牺牲性能的情况下大幅降低功耗。与限制主频的方法相比,设置功耗墙或温度墙有明显优势,能在低载下能自动“睿”到较高频率,在不跑任务时也能保持流畅度。
如果你会折腾CPU电压而且买的CPU体质不错,可以在保证稳定的基础上给CPU适当降压,这是免费降温的好方法。但是,一定要保证降压后的稳定性,不会折腾就不要折腾!!
|
评分 Rate
-
查看全部评分 View all ratings
|