计算化学公社

标题: 请教如何设置E5-2678v3*2 + GeForce RTX 2080 *2和 I5-9600K +RTX2060 [打印本页]

作者
Author:
qinzhong605    时间: 2019-8-3 13:59
标题: 请教如何设置E5-2678v3*2 + GeForce RTX 2080 *2和 I5-9600K +RTX2060
    请教一下大家,跑gromacs2019.03,参考了社长的硬件配置推荐,配置了两台电脑,分别是XEON E5-2678v3*2 + GeForce RTX 2080 *2 (-nt 24 -pin on),64G内存,和 I5-9600K +RTX2060(-nt 6 -pin on),16G内存;两者均是固态硬盘。系统是centos7.6的X64,都按照社长的帖子来安装,并设置用了GPU加速,测试同一个小的任务(160多个氨基酸片段的蛋白和2万多个水分子,),前者需要时间是7h30min,后者需要时间是8h30min,是哪里没设置对?貌似前者性价比很低啊。 哪位大神能解疑一下呢?
    在群里问了几次了,是不是问题太过于泛泛还是太简单了,没有大神愿意回答,因此论坛发帖子请教一下大家有什么好的建议没?第一次发帖子,如果有什么不对,请多多包涵!


作者
Author:
倪宇晴    时间: 2019-8-3 14:27
本帖最后由 倪宇晴 于 2019-8-3 14:31 编辑

少给几个核心试试,我的1070Ti就是18核性能到70%,36核才60%左右。
作者
Author:
fhh2626    时间: 2019-8-3 16:47
最好不要用两块GPU跑一个作业,这样会在数据传输上损失一部分性能,同样的道理CPU核心也不要给太多
作者
Author:
qinzhong605    时间: 2019-8-3 16:59
倪宇晴 发表于 2019-8-3 14:27
少给几个核心试试,我的1070Ti就是18核性能到70%,36核才60%左右。

非常谢谢建议!我试试,一般给多少核心好一些呢?
作者
Author:
qinzhong605    时间: 2019-8-3 17:00
fhh2626 发表于 2019-8-3 16:47
最好不要用两块GPU跑一个作业,这样会在数据传输上损失一部分性能,同样的道理CPU核心也不要给太多

的确两个gpu跑一个任务比一个gpu还慢,那么实际应用过程,能否实现,可以怎么设定同时跑两个任务,每个任务分别指定其中的一个GPU呢?
作者
Author:
bobosiji    时间: 2019-8-3 18:26
qinzhong605 发表于 2019-8-3 17:00
的确两个gpu跑一个任务比一个gpu还慢,那么实际应用过程,能否实现,可以怎么设定同时跑两个任务,每个任 ...

看mdrun的help文档  -gpu_id ?
作者
Author:
ggdh    时间: 2019-8-3 22:54
就是这样的  过两天我会专门发一个测试帖子说明原因
作者
Author:
qinzhong605    时间: 2019-8-3 23:08
ggdh 发表于 2019-8-3 22:54
就是这样的  过两天我会专门发一个测试帖子说明原因

期待,我现在把一张2080拆下来装到另外的机子上去了,不然挂在目前的机子纯粹浪费!一张卡跑得比两张卡还快得多!
作者
Author:
biogon    时间: 2019-8-3 23:31
2080的机器只用单卡看看,也有可能是并行效率的问题
作者
Author:
qinzhong605    时间: 2019-8-3 23:44
biogon 发表于 2019-8-3 23:31
2080的机器只用单卡看看,也有可能是并行效率的问题

试了,单卡效率能到80%以上,双卡的话,每个卡都不到40%,所以已经拆卡装到别的机子了。
作者
Author:
biogon    时间: 2019-8-3 23:45
qinzhong605 发表于 2019-8-3 23:44
试了,单卡效率能到80%以上,双卡的话,每个卡都不到40%,所以已经拆卡装到别的机子了。

那就是并行效率不行,可以两个卡装一个机器分别跑不同任务
作者
Author:
搞理论的    时间: 2019-8-4 04:06
楼主,你第一台用GPU跑的同时,CPU也可以跑任务吗?GPU和CPU同时跑的话,会不会互相影响速度?
作者
Author:
qinzhong605    时间: 2019-8-4 11:56
搞理论的 发表于 2019-8-4 04:06
楼主,你第一台用GPU跑的同时,CPU也可以跑任务吗?GPU和CPU同时跑的话,会不会互相影响速度?

有一定影响,可能是我代码的原因。高手应该不存在这个问题吧。不过两个这么打工了显卡塞在一个机箱里,散热需要好好考虑!
作者
Author:
搞理论的    时间: 2019-8-4 14:48
qinzhong605 发表于 2019-8-4 11:56
有一定影响,可能是我代码的原因。高手应该不存在这个问题吧。不过两个这么打工了显卡塞在一个机箱里,散 ...

我在考虑的是装了显卡之后可以用gpu跑,或许速度有所增加,但是如果原有cpu完全被废掉了,那性价比就打了折扣了,毕竟cpu也不便宜
作者
Author:
biogon    时间: 2019-8-4 23:59
搞理论的 发表于 2019-8-4 14:48
我在考虑的是装了显卡之后可以用gpu跑,或许速度有所增加,但是如果原有cpu完全被废掉了,那性价比就打了 ...

纯GPU运行的程序不需要很好的CPU的
作者
Author:
sobereva    时间: 2019-8-5 02:05
GROMACS GPU加速性能测试文章(JCC,2019)
http://bbs.keinsci.com/thread-13910-1-1.html

这个帖子提到的文章里作者在网站上给出了他们测试用的tpr文件,你可以尝试跑一下和他们的结果进行对照,尝试弄清楚是否哪里有严重问题
作者
Author:
qinzhong605    时间: 2019-8-5 10:40
sobereva 发表于 2019-8-5 02:05
GROMACS GPU加速性能测试文章(JCC,2019)
http://bbs.keinsci.com/thread-13910-1-1.html

谢谢社长,我研究一下。
作者
Author:
abdoman    时间: 2019-8-5 14:34
在gpu加速的时候,注意P2P通讯,以及CPU的管理。最好是不跨CPU,不跨GPU
https://zhuanlan.zhihu.com/p/21908564

作者
Author:
搞理论的    时间: 2019-8-7 03:09
abdoman 发表于 2019-8-5 14:34
在gpu加速的时候,注意P2P通讯,以及CPU的管理。最好是不跨CPU,不跨GPU
https://zhuanlan.zhihu.com/p/21 ...

怎么才能做到不夸CPU且不跨GPU呢?
作者
Author:
abdoman    时间: 2019-8-7 08:53
先了解自己服务器的拓扑结构,链接里面有命令
然后在计算的时候,请求GPU的时候,你就知道该选择哪个GPU了。
amber 里面可以指定GPU ( CUDA_VISIBLE_DEVICES=xxx),gromacs我不知道是什么。
作者
Author:
bobosiji    时间: 2019-8-24 22:42
前者需要时间是7h30min,后者需要时间是8h30min : 跑了多少ns?体系一共多少原子?




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3