计算化学公社

标题: 鸟枪换炮以后,3090也没想象的那么香 [打印本页]

作者
Author:
牧生    时间: 2020-11-23 09:55
标题: 鸟枪换炮以后,3090也没想象的那么香
本帖最后由 牧生 于 2020-11-23 10:03 编辑

之前用的是1080TI

现在换成了3090,运行一个9.1万个原子的表面活性剂体系,3090的速度并没有想的那么快啊,每天才50 ns。
(, 下载次数 Times of downloads: 55)

看样子驱动都是正确的,能运行

(, 下载次数 Times of downloads: 50)


速度只有每天50 ns,比1080TI提升并不是很明显
(, 下载次数 Times of downloads: 60)

作者
Author:
liuyuje714    时间: 2020-11-23 10:26
你这个测试不对劲,第一体系太小,第二起码应该达到100 ns/day左右。看你的截图怎么会有两个gmx进程id。
作者
Author:
牧生    时间: 2020-11-23 11:25
OK,增大体系再继续试试呢。我也希望速度快起来啊。
作者
Author:
fhh2626    时间: 2020-11-23 11:58
本帖最后由 fhh2626 于 2020-11-23 12:00 编辑

有2个GMX进程在同一个GPU上肯定会慢一些,而且GPU占用率似乎也不是很高

用OpenMM或者Amber这种能挤干GPU的软件的结果会比较有说服力
作者
Author:
k64_cc    时间: 2020-11-23 12:44
fhh2626 发表于 2020-11-23 11:58
有2个GMX进程在同一个GPU上肯定会慢一些,而且GPU占用率似乎也不是很高

用OpenMM或者Amber这种能挤干GPU ...

OpenMM对GPU的利用效率其实也没太完美,卡80%~90%也经常能见到。Amber倒是日常100%,快得让我担心自己是不是写错了……
作者
Author:
牧生    时间: 2020-11-23 14:13
本帖最后由 牧生 于 2020-11-23 14:15 编辑
liuyuje714 发表于 2020-11-23 10:26
你这个测试不对劲,第一体系太小,第二起码应该达到100 ns/day左右。看你的截图怎么会有两个gmx进程id。

重启机子以后,重新进行运行,速度有了提升。。
仍然是这个9.1万原子的体系,70多ns每天了

(, 下载次数 Times of downloads: 55)

(, 下载次数 Times of downloads: 52)



然后,建立一个44万原子的体系,18 ns/day,

(, 下载次数 Times of downloads: 45)


(, 下载次数 Times of downloads: 48)

那么,有没有更好的办法,尽量提高gromacs对GPU的利用效率啊??




作者
Author:
liuyuje714    时间: 2020-11-23 14:38
牧生 发表于 2020-11-23 14:13
重启机子以后,重新进行运行,速度有了提升。。
仍然是这个9.1万原子的体系,70多ns每天了

我不知道你具体用的哪款cpu,如果cpu不是瓶颈,我认为你应该尽可能的把运算放到gpu上面,可以在mdrun后面添加这些参数试一试是否提升。-nb gpu -pme gpu -bonded gpu -update gpu
作者
Author:
牧生    时间: 2020-11-23 14:41
liuyuje714 发表于 2020-11-23 14:38
我不知道你具体用的哪款cpu,如果cpu不是瓶颈,我认为你应该尽可能的把运算放到gpu上面,可以在mdrun后面 ...

6149双路,我试试你的建议
作者
Author:
fhh2626    时间: 2020-11-23 16:09
k64_cc 发表于 2020-11-23 12:44
OpenMM对GPU的利用效率其实也没太完美,卡80%~90%也经常能见到。Amber倒是日常100%,快得让我担心自己是 ...

omina-dev上面的OpenMM版本比Amber快10%左右,正式版要比Amber慢一些
作者
Author:
chemcomp    时间: 2020-12-4 21:51
请教楼上各位大佬一个问题,我看好几个研究组以及超算中心列出来的GPU都是计算卡,如K80,P100,V100等,使用这些计算卡跑MD(混合精度或单精度)和游戏卡(如2080TI)得到的结果一样吗?如果一样的话,他们为什么不用性价比更高的游戏卡呢?另外我看amber网站的benchmark以及openmm网站上的benchmark都测试过游戏卡,这么说来计算卡和游戏卡得到的结果应该几乎没有差异?
作者
Author:
ikea1984    时间: 2020-12-9 12:56
chemcomp 发表于 2020-12-4 21:51
请教楼上各位大佬一个问题,我看好几个研究组以及超算中心列出来的GPU都是计算卡,如K80,P100,V100等,使 ...

因为确实有些单位壕无人性。。。
作者
Author:
chemcomp    时间: 2020-12-11 18:07
本帖最后由 chemcomp 于 2020-12-12 13:44 编辑
ikea1984 发表于 2020-12-9 12:56
因为确实有些单位壕无人性。。。

但至少超算中心是要挣钱的啊,游戏卡性价比不是更高吗?我感觉做深度学习用游戏卡的好像比较多,MD的话小课题组用游戏卡也挺多,大组用计算卡的要更多。@abin  您认为呢?
作者
Author:
abin    时间: 2020-12-12 15:23
chemcomp 发表于 2020-12-11 18:07
但至少超算中心是要挣钱的啊,游戏卡性价比不是更高吗?我感觉做深度学习用游戏卡的好像比较多,MD的话小 ...

我买什么看法。

只是部分资料认为, 游戏卡稳定性不足,双精度要么没有,要么太菜,在计算方面,尤其是量化计算方面,没啥用。

我没有其他看法。

看提示有人提到我, 这一顿找啊。
最后用搜索才定位到,谁提到了我。
这个功能设定好鸡肋。
作者
Author:
ikea1984    时间: 2020-12-14 13:54
chemcomp 发表于 2020-12-11 18:07
但至少超算中心是要挣钱的啊,游戏卡性价比不是更高吗?我感觉做深度学习用游戏卡的好像比较多,MD的话小 ...

超算中心的建设费和后期的收入可能并不是一条线。。。
不能拿高校运作一个课题组的看法去评判超算中心和一些土鳖研究所。。。
作者
Author:
chemcomp    时间: 2020-12-15 16:46
abin 发表于 2020-12-12 15:23
我买什么看法。

只是部分资料认为, 游戏卡稳定性不足,双精度要么没有,要么太菜,在计算方面,尤其 ...

谢谢您的回复。
在量化计算方面,游戏卡或者计算卡都挺鸡肋的好像。在MD方面不知道二者对于模拟的具体影响是什么(除了速度之外)。有人做过相关的测试吗?
我是个小菜鸡,问题可能太初级。
作者
Author:
chemcomp    时间: 2020-12-15 16:50
ikea1984 发表于 2020-12-14 13:54
超算中心的建设费和后期的收入可能并不是一条线。。。
不能拿高校运作一个课题组的看法去评判超算中心和 ...

不太明白您的意思。我只是从一个菜鸟的角度想知道游戏卡/计算卡对于MD模拟准确性的影响
对于超算中心/高校/研究所的具体情况就不了解了
作者
Author:
abin    时间: 2020-12-15 19:27
chemcomp 发表于 2020-12-15 16:46
谢谢您的回复。
在量化计算方面,游戏卡或者计算卡都挺鸡肋的好像。在MD方面不知道二者对于模拟的具体影 ...

与算法有关系。
量子化学类的计算,
多说需要双精度,且无法一下子扩展到上千个核心并行。
所以cuda 核心再多,也没啥用。

游戏卡缺少ECC内存,长期运行,
我指的是,连续长时间高负载,
可能出现稳定性不足,
有可能出现数据可靠性问题。
如果是分子动力学,可以忽略这个影响。
可以单精度多跑一些轨迹,
然后摒弃不合理的轨迹,
再统计分析就可以了。

专业卡,游戏卡差价那么大,
难道买专业卡的人都是傻子吗?
作者
Author:
hlfancomeon    时间: 2021-4-29 23:04
买了3090  还不知到 怎么加速
作者
Author:
biogon    时间: 2021-4-30 11:30
chemcomp 发表于 2020-12-4 21:51
请教楼上各位大佬一个问题,我看好几个研究组以及超算中心列出来的GPU都是计算卡,如K80,P100,V100等,使 ...

需要双精度的地方多了,超算中心不可能只考虑需求单精度的用户
作者
Author:
xiamiaoren    时间: 2021-4-30 17:27
公开的数据中心服务器是不能装游戏卡来卖的
作者
Author:
vv_c    时间: 2021-5-2 09:57
香在大显存。看看现在的价格翻番,更香了。
作者
Author:
b3115321    时间: 2021-5-2 20:18
楼主转手卖了赚一倍了哈哈




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3