13和14代intel缩缸之后性能对齐amd有优势吗 |
请问,4090D和4080如何选择?4090D能不能把贵出的价格值回来呢。 |
wangyueda 发表于 2024-3-12 11:01 外行可能会认为“有GPU就行”,殊不知在科学计算这种小领域,没什么程序能做到让CPU性能不拖累GPU,CPU往往会成为整个计算的瓶颈。底层的优化只有AI行业有充足的人力去做。 |
本帖最后由 wangyueda 于 2024-4-10 20:44 编辑 Entropy.S.I 发表于 2024-3-12 10:39 好的谢谢楼主,我再试试。 |
wangyueda 发表于 2024-3-12 10:32 不一定,需要根据CPU架构仔细调优,尽可能减少核间延迟的影响。EPYC 7402每个CCX只有3核,只用3核6线程,把所有omp线程绑定到同一个CCX中可能比用更多核还快。对于这种核间延迟很烂的CPU,1个MPI Rank不建议用很多核 |
Entropy.S.I 发表于 2024-3-12 10:11 好的谢谢楼主,所以我这速度(91.220 ns/day)差不多也是当前配置下的极限了对吧 |
本帖最后由 Entropy.S.I 于 2024-3-12 10:34 编辑 wangyueda 发表于 2024-3-11 17:02 CPU烂得一蹋糊涂,这种情况下-bonded gpu更快不意外 http://bbs.keinsci.com/thread-39266-1-1.html 看最后一张图,价值不到3000的4060都比你们价值10万多的的A100快 |
请问下楼主,我用您的测试集中的体系B在课题组服务器上跑,最高也只能跑91.220 ns/day,与您的最高性能300多ns/day差距较大是为啥?而且我的“-update gpu -bonded gpu”要比“-update gpu”速度快些(前者91.220 ns/day,后者76.52791.220 ns/day)。而且-ntomp=1要比-ntomp>1(8,12,16等)都快,请问下我的问题出在哪?谢谢楼主 我的机器参数: CPU:AMD EPYC 7402 24-Core Processor GPU: A100*8 gmx版本信息:
提交脚本:
|
gauss98 发表于 2024-1-19 09:32 搭平台成本过高,没测过,也没有必要测。多卡机器每块卡的CPU和通信资源都是独立的。 |
感谢博主测试, 问问有没有多卡性能测试? 6卡8卡4090 (D?) 的配置和测试 谢谢! |
Entropy.S.I 发表于 2023-10-24 16:53 谢谢老师 |
五月雨 发表于 2023-10-24 16:03 -pin on -pinoffset [?] -pinstride 1 ntmpi 1 -ntomp [?] -gpu_id [0/1] -update gpu -bonded [cpu/gpu] |
Entropy.S.I 发表于 2022-10-31 20:01 请问老师,两张显卡分别计算两个GMX任务,应该使用什么命令? |
请问老师如何看待网传的禁售RTX 4090的消息,对分子动力学模拟方面的硬件购置影响,以及有哪些高性价比的替代产品 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2024-11-23 08:30 , Processed in 0.192135 second(s), 27 queries , Gzip On.