计算化学公社

标题: gromacs用gpu极限能加速多少? [打印本页]

作者
Author:
htlzkahsy    时间: 2021-7-28 17:41
标题: gromacs用gpu极限能加速多少?
考虑gpu耗时为0的极限情况,总ns/day能降到纯cpu的多少%?
作者
Author:
htlzkahsy    时间: 2021-7-28 17:42
能升到纯cpu的多少%。。笔误
作者
Author:
jessi    时间: 2021-7-28 17:48
极限具体要看你测例能用gpu算的力场的占比,github上有个gpu单卡3倍加速的测例: https://github.com/Biu-G/gromacs-rocm ,用的是AMD的MI100显卡
作者
Author:
jessi    时间: 2021-7-28 17:48
我没钱没试过,谁有条件试试。。
作者
Author:
htlzkahsy    时间: 2021-7-28 17:51
jessi 发表于 2021-7-28 17:48
极限具体要看你测例能用gpu算的力场的占比,github上有个gpu单卡3倍加速的测例: https://github.com/Biu-G/ ...

amd的怎么比nvidia的还快。。双卡只加这么点吗?
作者
Author:
jessi    时间: 2021-7-28 17:54
htlzkahsy 发表于 2021-7-28 17:51
amd的怎么比nvidia的还快。。双卡只加这么点吗?

amd instinct系列专门搞HPC的所以快,nvidia显卡设置兼顾AI和HPC。Gromacs多卡增益听说不行,高性能单卡比低性能多卡有优势,加多卡损耗太大。不过都是说pcie互联,fabric link / nvlink互连不知道损耗能不能接受。
作者
Author:
Graphite    时间: 2021-7-29 00:16
讨论这个极限意义不大,一看软硬件配置,二看体系,耗时主要花在一些长程pair形式、PME等能吃到GPU的加速就快,不断刷新neighbour列表、并行comm消耗大的加速就慢。
有些计算4核+单GPU都能拼32核CPU,有些带了GPU反而变慢,甚至16核>32核>32核+双卡都是有可能的。
只能说对于你算的东西能加速几倍,建议跑大批量之前先拿短时长把各种组合(n个CPU+m个GPU)都试一试,不总是资源投的越多越快。
作者
Author:
sobereva    时间: 2021-7-29 05:40
htlzkahsy 发表于 2021-7-28 17:42
能升到纯cpu的多少%。。笔误

有别人回复之前若需要对帖子进行修改、补充,应直接编辑原帖,不要通过回帖进行补充,这点在置顶的新社员必读贴里明确说了
作者
Author:
sun666    时间: 2021-7-29 10:47
8核+3070显卡跑GPU加速跟64核差不多....




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3