本帖最后由 ggdh 于 2022-4-5 22:23 编辑
测试方法:
使用脚本xbench.sh进行测试, 体系为脚本自带的Gaussian中的test397, 具体测试命令先下面各个部分,使用方法参考:g09/g16速度测试脚本xbench 2.0
测试过程中均考虑了NUMA效应, NUMA策略为分布式(尽可能让两块cpu平均承担任务), NUMA策略的说明见:NUMA策略对Gaussian运算速度影响的小研究
测试环境:
8375C, 7742, 和7T83均为双路
内存: 16*32 3200MHz,
系统: Fedora release 35
内核: 5.15.16-200.fc35.x86_64
G16版本: A03, AVX2版
算力计算公式:
算力= (1000*同时进行任务数) / 所有任务平均耗时
测试一, 单任务算力测试
说明: 只算一个任务测试命令:
- xbench.sh -n 4,4,m -t 1 -r 3 -k "b3lyp 3-21g force test scf=novaracc"
复制代码
结论:
- 都用64核的话7T83和8375C速度差不多, 这里8375C的频率是3.5, 而7T83的频率是3.1, 这说明只跑一个任务8375C的高频并不能给他带来更快的速度
- 并行超过64核后算力提升非常小(所以如果用7T83和7742只跑一个Gaussian任务的话, 血亏)(此结论错误,见后面测试四)
测试二, 多任务算力测试
说明: 同时算多个Gaussian 任务, 每个任务8核
测试命令:
- xbench.sh -n 8 -t 1,1,m -r 3 -k "b3lyp 3-21g force test scf=novaracc"
复制代码
结论:8375C相比8269CY还是打了鸡血的, 估计是intel感觉被amd超的有点猛, 所以决定这次多挤一点牙膏?
测试三, 各种任务的满载性能对比
说明:32核满载是指8375C同时运行2个一样的32核任务, 7T83同时运行4个一样的32核任务
测试命令,以freq任务为例:
- xbench.sh -n 32 -t m -r 3 -k "b3lyp 3-21g freq"
复制代码 64核满载是指8375C运行一个64核任务,7T83同时运行2个一样的64核任务
测试命令,以td任务为例:
- xbench.sh -n 64 -t m -r 3 -k "b3lyp 3-21g td"
复制代码
结论:
满载32核或者64核的情况下, 7T83的算力大概是8375C的1.6倍左右.
测试四, 各种大任务的128核vs64核对比
有兄弟想知道大任务用128核相对64核并行是否能显著提升效率, 我也好奇这个, 于是有了这个测试
下面的测试是同时只跑一个任务的结果, 结果如下表:
结论:
1. 对于大任务,128核比64核有明显的加速,大概可以达到1.4倍算力
2. 1块8375C的满载64核, 基本和1块7T83的半负载(64核)持平或不如
最后,为了方便大家和自己的机器做比较列出几个耗时
体系:test0397
关键词:#p b3lyp 3-21g force test scf=novaracc g09default
并行核数:64
内存:400GB
只跑一个任务
8375C: 31.36秒
7T83: 31.52秒
7742: 36.96秒
|