计算化学公社

标题: namd对GPU利用率很低 [打印本页]

作者
Author:
yl233    时间: 2021-3-12 16:46
标题: namd对GPU利用率很低
本帖最后由 yl233 于 2021-3-12 16:50 编辑

向各位请教一下,namd对CPU的依赖性很强吗?使用GPU加速的namd,在4-16个核的情况下,对一块GPU的利用率只有8%-50%,这是为什么呢?

作者
Author:
fhh2626    时间: 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支,并且编译--with-single-cuda版本
作者
Author:
fhh2626    时间: 2021-3-12 16:55
fhh2626 发表于 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支,并且编译--with-single-cuda版本

不过如果你要用Colvars的功能的话还是只能跑传统版本的
作者
Author:
yl233    时间: 2021-3-12 19:19
fhh2626 发表于 2021-3-12 16:55
不过如果你要用Colvars的功能的话还是只能跑传统版本的

我应该不用Colvars的功能,只是跑SMD,不用Colvars算结合自由能。但是打不开你给的链接,不是很懂devel分支,是用了这个就可以加快吗?请问有详细的编译教程或者关于devel的介绍吗?
作者
Author:
fhh2626    时间: 2021-3-13 08:52
yl233 发表于 2021-3-12 19:19
我应该不用Colvars的功能,只是跑SMD,不用Colvars算结合自由能。但是打不开你给的链接,不是很懂devel分 ...

你要先注册一个帐号

devel分支就是开发版,速度会快很多,GPU利用率都是99%
作者
Author:
yl233    时间: 2021-3-13 12:39
fhh2626 发表于 2021-3-13 08:52
你要先注册一个帐号

devel分支就是开发版,速度会快很多,GPU利用率都是99%

请问这个devel分支开发版和namd官网上的source code是一样的吗?我是不是也可以用官网上这个https://www.ks.uiuc.edu/Developm ... gi?PackageName=NAMD
作者
Author:
fhh2626    时间: 2021-3-15 09:26
yl233 发表于 2021-3-13 12:39
请问这个devel分支开发版和namd官网上的source code是一样的吗?我是不是也可以用官网上这个https://www. ...

官网上的话,你要下single node版本
作者
Author:
退休老干部    时间: 2021-3-24 14:51
fhh2626 发表于 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支,并且编译--with-single-cuda版本

您好,大佬,请问你这发的链接打不开是怎么回事,去了这个链接的namd主页看了看,也没有devel版
作者
Author:
Amphibiouskii    时间: 2023-7-19 17:20
fhh2626 发表于 2021-3-12 16:55
不过如果你要用Colvars的功能的话还是只能跑传统版本的

我也遇到了这个问题,GPU的占用率只有40%左右,不过使用了colvars,是使用colvars功能了就会这样吗?还是说是binary版本的原因……
作者
Author:
fhh2626    时间: 2023-7-20 12:07
Amphibiouskii 发表于 2023-7-19 17:20
我也遇到了这个问题,GPU的占用率只有40%左右,不过使用了colvars,是使用colvars功能了就会这样吗?还是 ...

使用了Colvars就是这样

不用的话,加上CUDASOAIntegrate   on,GPU利用率可以达到99%
作者
Author:
DwyaneWan    时间: 2024-3-27 23:59
fhh2626 发表于 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支,并且编译--with-single-cuda版本

老师你好,我使用了colvars之后,gpu占用率16%,cpu给的越多,速度也没见提升很多呢。 这个正常吗
作者
Author:
fhh2626    时间: 2024-3-28 10:13
DwyaneWan 发表于 2024-3-27 23:59
老师你好,我使用了colvars之后,gpu占用率16%,cpu给的越多,速度也没见提升很多呢。 这个正常吗

下最新版(3.0b6),在configure文件里面加上cudasoaintegrate   on,CPU只给一个核,利用率就会变高
作者
Author:
DwyaneWan    时间: 2024-4-11 10:39
fhh2626 发表于 2024-3-28 10:13
下最新版(3.0b6),在configure文件里面加上cudasoaintegrate   on,CPU只给一个核,利用率就会变高

那fu老师,如果在conf中加入了wrap 所有分子 会影响速度吗
作者
Author:
fhh2626    时间: 2024-4-11 11:22
DwyaneWan 发表于 2024-4-11 10:39
那fu老师,如果在conf中加入了wrap 所有分子 会影响速度吗

不会
作者
Author:
Azrael    时间: 2024-5-18 10:30
fhh2626 发表于 2024-3-28 10:13
下最新版(3.0b6),在configure文件里面加上cudasoaintegrate   on,CPU只给一个核,利用率就会变高

付老师您好,我用的是3.0b7版本NAMD3,namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log &跑起来没问题;
在configure文件里面加上cudasoaintegrate   on,CPU改为一运行namd3 +p1 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & 就会报错FATAL ERROR: CUDA error cudaStreamSynchronize(stream) in file src/CudaTileListKernel.cu, function buildTileLists, line 1141
on Pe 0 (rocky9 device 1 pci 0:3b:0): an illegal memory access was encountered
,请问可能是什么原因呢
作者
Author:
fhh2626    时间: 2024-5-18 14:03
Azrael 发表于 2024-5-18 10:30
付老师您好,我用的是3.0b7版本NAMD3,namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & ...

可以尝试自己编译一下,预编译版兼容性不是很强

作者
Author:
Azrael    时间: 2024-5-19 22:47
fhh2626 发表于 2024-5-18 14:03
可以尝试自己编译一下,预编译版兼容性不是很强

好的,谢谢付老师~
作者
Author:
Azrael    时间: 2024-5-20 10:06
fhh2626 发表于 2021-3-12 16:55
不过如果你要用Colvars的功能的话还是只能跑传统版本的

付老师,学生在尝试您的BFEE2,GPU没有跑满,您昨天建议我预编译一下。

但是我用到了Colvars功能,看您这条消息是只能用传统版本。

请问传统版本是在官网下载source dode编译还是去gitlab下载MAIN版本编译呢?
作者
Author:
fhh2626    时间: 2024-5-20 10:26
Azrael 发表于 2024-5-20 10:06
付老师,学生在尝试您的BFEE2,GPU没有跑满,您昨天建议我预编译一下。

但是我用到了Colvars功能,看 ...

那条消息过时了,现在最新版本也支持Colvars了。
你试试用3.0b7,在配置文件里面加上CUDASOAintegrate  on就行
作者
Author:
Azrael    时间: 2024-5-20 10:40
fhh2626 发表于 2024-5-20 10:26
那条消息过时了,现在最新版本也支持Colvars了。
你试试用3.0b7,在配置文件里面加上CUDASOAintegrate   ...

付老师,我前天在该贴的消息您可能没细看,只是建议我编译下,我再重复一遍哈:

”付老师您好,我用的是3.0b7版本NAMD3,namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log &跑起来没问题;

在configure文件里面加上cudasoaintegrate   on,CPU改为 1 ,

运行namd3 +p1 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & 就会报错

FATAL ERROR: CUDA error cudaStreamSynchronize(stream) in file src/CudaTileListKernel.cu, function buildTileLists, line 1141 on Pe 0 (rocky9 device 1 pci 0:3b:0): an illegal memory access was encountered

请问可能是什么原因呢“

我具体的版本是NAMD_3.0b7_Linux-x86_64-netlrts-smp-CUDA.tar,您看是不是得把cudasoaintegrate 换成CUDASOAintegrate这个报错就可以解决,或者BFEE2需要换个版本?还是需要编译呢?

学生觉得您的BFEE2非常牛逼,希望在自己的文章中引用,但是目前显卡没跑满导致效率很低,恳请您指正 !
作者
Author:
fhh2626    时间: 2024-5-20 11:46
Azrael 发表于 2024-5-20 10:40
付老师,我前天在该贴的消息您可能没细看,只是建议我编译下,我再重复一遍哈:

”付老师您好,我用的 ...

试试这个版本呢:
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)
作者
Author:
Azrael    时间: 2024-5-20 12:07
fhh2626 发表于 2024-5-20 11:46
试试这个版本呢:
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

好的,谢谢付老师
作者
Author:
Azrael    时间: 2024-5-20 16:04
本帖最后由 Azrael 于 2024-5-21 09:21 编辑
fhh2626 发表于 2024-5-20 11:46
试试这个版本呢:
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

付老师, 我用了Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration),GPU使用率确实提升上来了, 万分感谢 !!1





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3