计算化学公社

标题: 台式机想要加个独立显卡用GPU加速算GROMACS,请大家给点建议 [打印本页]

作者
Author:
MSer    时间: 2022-1-14 15:07
标题: 台式机想要加个独立显卡用GPU加速算GROMACS,请大家给点建议
本帖最后由 MSer 于 2022-1-14 15:14 编辑

        大家好,最近拜读了sobereva大佬的:GROMACS的原生Windows版的编译和安装方法(http://bbs.keinsci.com/thread-11848-1-1.html),而自己的模拟体系比较大,约27万个原子,想要用GPU加速提高计算速度,但奈何在下对计算机配置方面是个小白,特此向各位大佬求助,请问我可以买个什么样的独显呢?(台式机,预算2000-5000左右,如果性能提升明显,预算还可以增加),以下是我台式机配置,请大家提提宝贵意见,万分感谢!

台式机配置:

CPU:    i5-11500
散热器:九州风神玄冰400
主板:   微星B560M BOMBER
内存:   海盗船复仇者8G*2 DDR4 3200
系统盘:三星9A1  512G M.2 NVME
仓库盘:希捷1T  7200 r/min
机箱:   先马工匠5号 商用中塔式
电源 :  长城GW-6000SW 额定500W
显示器:红米1A 24寸




作者
Author:
牧生    时间: 2022-1-14 15:55
本帖最后由 牧生 于 2022-1-14 16:04 编辑

看起来你的预算不多啊
GPU跑gromacs比CPU快数十倍,所以,十分十分有必要配制显卡。
你的体系有27万原子的话,纯CPU,估计几乎跑不动,或者慢的你根本没耐心等到1 ns。。

由于预算好像不是很充分,那么最低最低档,也建议1080TI。即使买二手的1080TI(虽然性能也还算不错)。但是你的体系也不算小,1080TI每天大约也就10多ns,估计后期跑来的时候,你自己会觉得慢的受不了,还不如增加点钱,一步到位,直接买个2080TI及以上的卡。

其他硬件方面,一千人有一千种说法,主要还是看自己用起来觉得合适就行。
作者
Author:
sobereva    时间: 2022-1-14 16:00
这里明确说了GPU加速的配置
计算化学购机配置推荐
http://sobereva.com/444

PS:以后甭用长城的破电源
作者
Author:
MSer    时间: 2022-1-14 16:10
牧生 发表于 2022-1-14 15:55
看起来你的预算不多啊
GPU跑gromacs比CPU快数十倍,所以,十分十分有必要配制显卡。
你的体系有 ...

好的,那我跟导师再说说,哈哈,谢谢
作者
Author:
MSer    时间: 2022-1-14 16:20
sobereva 发表于 2022-1-14 16:00
这里明确说了GPU加速的配置
计算化学购机配置推荐
http://sobereva.com/444

好的,谢谢sob老师,这篇我也看了,只是不知道3070对我的电脑配置适不适用(能不能发挥显卡性能),就先来问一问大家有什么其他建议

作者
Author:
MSer    时间: 2022-1-14 16:45
牧生 发表于 2022-1-14 15:55
看起来你的预算不多啊
GPU跑gromacs比CPU快数十倍,所以,十分十分有必要配制显卡。
你的体系有 ...

抱歉打扰您了,冒昧的问一下,有大致的运行速度对比吗?就例如27万原子,1080Ti一天10几ns,2080Ti一天多少ns这样的直观的对比吗?
是否可以借鉴显卡性能天梯跑分进行对比,比如NVIDIA GTX 1080Ti 943分 ;NVIDIA GeForce GTX 2080Ti 1207分; NVIDIA GeForce GTX 3070Ti 1295分; 那 2080Ti 的计算速度就是1080Ti 的1.3倍这样吗,还是说没有直接的关联呢。
作者
Author:
牧生    时间: 2022-1-14 16:51
本帖最后由 牧生 于 2022-1-18 14:30 编辑
MSer 发表于 2022-1-14 16:45
抱歉打扰您了,冒昧的问一下,有大致的运行速度对比吗?就例如27万原子,1080Ti一天10几ns,2080Ti一天多 ...

我试了一下我现成的9.1万原子的表面活性剂体系,用的三点水模型,截断为1。
用gmx 2021.4,加了-update gpu选项,cpu使用16线程
3090的速度为 282 ns/day,GPU使用率85%
1080TI的速度为 120  ns/day, GPU使用率95%
我并不认为显卡天梯图与计算速度有简单的比例关系


使用一个29.3万原子的体系
3090的速度 87 ns/day , gpu使用率90%
1080TI的速度37 ns/day,    gpu使用率98%

若只使用CPU(6149)来跑,指定16核(开了超线性),速度为7.9 ns/day
经过速度对比,3090大约是1080TI的2.3~2.5倍的速度。


作者
Author:
MSer    时间: 2022-1-14 17:08
牧生 发表于 2022-1-14 16:51
我试了一下我现成的9.1万原子的表面活性剂体系,用的三点水模型。
用gmx 2021.4,加了-update gpu选项, ...

嗯嗯,好的,谢谢,大致有个参考就行
作者
Author:
Acee    时间: 2022-1-14 21:15
27万原子的体系,就你目前的预算,计算速度相当慢,想要达到一个较长的时间尺度,建议考虑使用coarse-grained model。这样的话,在GPU配置较差的情况下达到一个不错的时间尺度和空间尺度。
作者
Author:
sobereva    时间: 2022-1-15 07:18
coarse-grained model不能轻易用。很可能在折腾粗粒化模型上不仅浪费大量时间,最后还糟质疑,最后达到数据发表花的时间成本远高于直接用全原子模型,何况对于如今GPU加速来说算这样大小的体系根本不算什么事(除非要跑到微秒级别而且真有特别适合的粗粒化模型才适合用)。
作者
Author:
sobereva    时间: 2022-1-15 07:20
MSer 发表于 2022-1-14 16:20
好的,谢谢sob老师,这篇我也看了,只是不知道3070对我的电脑配置适不适用(能不能发挥显卡性能),就先 ...

3070完全适合用
作者
Author:
喵星大佬    时间: 2022-1-15 21:10
牧生 发表于 2022-1-14 16:51
我试了一下我现成的9.1万原子的表面活性剂体系,用的三点水模型,截断为1。
用gmx 2021.4,加了-update  ...

上次教你一个update给你省了多少时间啊,哈哈哈哈哈
作者
Author:
牧生    时间: 2022-1-16 08:00
喵星大佬 发表于 2022-1-15 21:10
上次教你一个update给你省了多少时间啊,哈哈哈哈哈

当事人非常开心
作者
Author:
lonemen    时间: 2022-1-16 09:56
牧生 发表于 2022-1-14 16:51
我试了一下我现成的9.1万原子的表面活性剂体系,用的三点水模型,截断为1。
用gmx 2021.4,加了-update  ...

咦,这个技巧好
作者
Author:
adong    时间: 2022-1-16 11:39
牧生 发表于 2022-1-14 16:51
我试了一下我现成的9.1万原子的表面活性剂体系,用的三点水模型,截断为1。
用gmx 2021.4,加了-update  ...

使用GPU加速,请问加入 -update gpu 选项,是只需要在cpu执行命令基础上多加入这个,还是也得同时指定 -nb gpu ?
作者
Author:
牧生    时间: 2022-1-16 11:52
本帖最后由 牧生 于 2022-1-16 11:55 编辑
adong 发表于 2022-1-16 11:39
使用GPU加速,请问加入 -update gpu 选项,是只需要在cpu执行命令基础上多加入这个,还是也得同时指定 -n ...

我用的命令是: gmx mdrun -deffnm md -v -ntomp 16 -ntmpi 1 -gpu_id 0 -update gpu      
我没有用-nb,也没有-pin on等。从我使用的经验来看,对于双路cpu+两个显卡,如果跑两个任务,且分别指定不同的显卡,指定CPU的核数不超过单CPU物理核心数的时候,gmx已经很聪明的会自动分别调用两个cpu,不会冲突。  对于在gpu上跑任务时,cpu核数不宜过多。你可以自行测试,开启和关闭超线程情况下的计算速度,指定不同cpu核数下的计算速度。

作者
Author:
dinghongming    时间: 2022-1-16 13:01
3060Ti应该可以,性价比也很高~
作者
Author:
adong    时间: 2022-1-16 21:32
牧生 发表于 2022-1-16 11:52
我用的命令是: gmx mdrun -deffnm md -v -ntomp 16 -ntmpi 1 -gpu_id 0 -update gpu      
我没有用-n ...

收到,非常感谢
作者
Author:
MSer    时间: 2022-1-17 08:35
sobereva 发表于 2022-1-15 07:20
3070完全适合用

好的,谢谢sob老师
作者
Author:
Entropy.S.I    时间: 2022-1-17 21:25
牧生 发表于 2022-1-14 15:55
看起来你的预算不多啊
GPU跑gromacs比CPU快数十倍,所以,十分十分有必要配制显卡。
你的体系有 ...

1080Ti跑27w原子,rvdw=1.4,榨干(利用率98+)后速度27ns/d,你这11也太慢了,1fs步长?
作者
Author:
Entropy.S.I    时间: 2022-1-17 21:28
牧生 发表于 2022-1-14 16:51
我试了一下我现成的9.1万原子的表面活性剂体系,用的三点水模型,截断为1。
用gmx 2021.4,加了-update  ...

用更强的CPU榨干显卡,3090(3080Ti)是1080Ti的3倍
作者
Author:
牧生    时间: 2022-1-17 21:53
Entropy.S.I 发表于 2022-1-17 21:25
1080Ti跑27w原子,rvdw=1.4,榨干(利用率98+)后速度27ns/d,你这11也太慢了,1fs步长?

我设置rvdw为1,用的2fs。1080ti有30多ns/day,我也不再奢求什么了。
6149能榨gpu到现在这个程度,我已经非常知足了。毕竟,我的主业也不靠模拟谋生。

作者
Author:
abdoman    时间: 2022-2-11 10:17
需要注意一点的是,你当前的电源是500W
就算只上1块GPU,这个功率肯定不够安全,至少也得750W往上走。
因此,需要换电源。
而且还得注意GPU的电源接口是2个8pin还是6+8pin(注意换电源时的模组线)
作者
Author:
chenbq18    时间: 2022-2-18 21:07
牧生 发表于 2022-1-14 16:51
我试了一下我现成的9.1万原子的表面活性剂体系,用的三点水模型,截断为1。
用gmx 2021.4,加了-update  ...

请问 您的gpu利用率怎么这么高。我的v100的卡32g,一万多个原子,利用率也就三四十。cpu给了10核,开了pin on反而更慢了呢
作者
Author:
牧生    时间: 2022-2-18 21:09
本帖最后由 牧生 于 2022-2-18 21:21 编辑
chenbq18 发表于 2022-2-18 21:07
请问 您的gpu利用率怎么这么高。我的v100的卡32g,一万多个原子,利用率也就三四十。cpu给了10核,开了pi ...

一万多原子,利用率三四十也差不多。GPU加速,要体系大了才能体现出优势,起码十万原子以上才能看出优势。
这个命令就足够了
gmx mdrun -deffnm md -v -ntomp 16 -ntmpi 1 -gpu_id 0 -update gpu        
作者
Author:
chenbq18    时间: 2022-2-19 10:35
牧生 发表于 2022-2-18 21:09
一万多原子,利用率三四十也差不多。GPU加速,要体系大了才能体现出优势,起码十万原子以上才能看出优势 ...

好的 多谢




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3