计算化学公社

标题: namd对GPU利用率很低 [打印本页]

作者
Author: yl233 时间: 2021-3-12 16:46
标题: namd对GPU利用率很低
本帖最后由 yl233 于 2021-3-12 16:50 编辑

向各位请教一下，namd对CPU的依赖性很强吗？使用GPU加速的namd，在4-16个核的情况下，对一块GPU的利用率只有8%-50%，这是为什么呢？

作者
Author: fhh2626 时间: 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支，并且编译--with-single-cuda版本

作者
Author: fhh2626 时间: 2021-3-12 16:55

fhh2626 发表于 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支，并且编译--with-single-cuda版本

不过如果你要用Colvars的功能的话还是只能跑传统版本的

作者
Author: yl233 时间: 2021-3-12 19:19

fhh2626 发表于 2021-3-12 16:55
不过如果你要用Colvars的功能的话还是只能跑传统版本的

我应该不用Colvars的功能，只是跑SMD，不用Colvars算结合自由能。但是打不开你给的链接，不是很懂devel分支

，是用了这个就可以加快吗？请问有详细的编译教程或者关于devel的介绍吗？

作者
Author: fhh2626 时间: 2021-3-13 08:52

yl233 发表于 2021-3-12 19:19
我应该不用Colvars的功能，只是跑SMD，不用Colvars算结合自由能。但是打不开你给的链接，不是很懂devel分 ...

你要先注册一个帐号

devel分支就是开发版，速度会快很多，GPU利用率都是99%

作者
Author: yl233 时间: 2021-3-13 12:39

fhh2626 发表于 2021-3-13 08:52
你要先注册一个帐号

devel分支就是开发版，速度会快很多，GPU利用率都是99%

请问这个devel分支开发版和namd官网上的source code是一样的吗？我是不是也可以用官网上这个https://www.ks.uiuc.edu/Developm ... gi?PackageName=NAMD

作者
Author: fhh2626 时间: 2021-3-15 09:26

yl233 发表于 2021-3-13 12:39
请问这个devel分支开发版和namd官网上的source code是一样的吗？我是不是也可以用官网上这个https://www. ...

官网上的话，你要下single node版本

作者
Author: 退休老干部 时间: 2021-3-24 14:51

fhh2626 发表于 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支，并且编译--with-single-cuda版本

您好，大佬，请问你这发的链接打不开是怎么回事，去了这个链接的namd主页看了看，也没有devel版

作者
Author: Amphibiouskii 时间: 2023-7-19 17:20

fhh2626 发表于 2021-3-12 16:55
不过如果你要用Colvars的功能的话还是只能跑传统版本的

我也遇到了这个问题，GPU的占用率只有40%左右，不过使用了colvars，是使用colvars功能了就会这样吗？还是说是binary版本的原因……

作者
Author: fhh2626 时间: 2023-7-20 12:07

Amphibiouskii 发表于 2023-7-19 17:20
我也遇到了这个问题，GPU的占用率只有40%左右，不过使用了colvars，是使用colvars功能了就会这样吗？还是 ...

使用了Colvars就是这样

不用的话，加上CUDASOAIntegrate on，GPU利用率可以达到99%

作者
Author: DwyaneWan 时间: 2024-3-27 23:59

fhh2626 发表于 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支，并且编译--with-single-cuda版本

老师你好，我使用了colvars之后，gpu占用率16%，cpu给的越多，速度也没见提升很多呢。

这个正常吗

作者
Author: fhh2626 时间: 2024-3-28 10:13

DwyaneWan 发表于 2024-3-27 23:59
老师你好，我使用了colvars之后，gpu占用率16%，cpu给的越多，速度也没见提升很多呢。这个正常吗

下最新版（3.0b6），在configure文件里面加上cudasoaintegrate on，CPU只给一个核，利用率就会变高

作者
Author: DwyaneWan 时间: 2024-4-11 10:39

fhh2626 发表于 2024-3-28 10:13
下最新版（3.0b6），在configure文件里面加上cudasoaintegrate on，CPU只给一个核，利用率就会变高

那fu老师，如果在conf中加入了wrap 所有分子会影响速度吗

作者
Author: fhh2626 时间: 2024-4-11 11:22

DwyaneWan 发表于 2024-4-11 10:39
那fu老师，如果在conf中加入了wrap 所有分子会影响速度吗

不会

作者
Author: Azrael 时间: 2024-5-18 10:30

fhh2626 发表于 2024-3-28 10:13
下最新版（3.0b6），在configure文件里面加上cudasoaintegrate on，CPU只给一个核，利用率就会变高

付老师您好，我用的是3.0b7版本NAMD3，namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log &跑起来没问题；
在configure文件里面加上cudasoaintegrate on，CPU改为一运行namd3 +p1 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & 就会报错FATAL ERROR: CUDA error cudaStreamSynchronize(stream) in file src/CudaTileListKernel.cu, function buildTileLists, line 1141
on Pe 0 (rocky9 device 1 pci 0:3b:0): an illegal memory access was encountered
，请问可能是什么原因呢

作者
Author: fhh2626 时间: 2024-5-18 14:03

Azrael 发表于 2024-5-18 10:30
付老师您好，我用的是3.0b7版本NAMD3，namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & ...

可以尝试自己编译一下，预编译版兼容性不是很强

作者
Author: Azrael 时间: 2024-5-19 22:47

fhh2626 发表于 2024-5-18 14:03
可以尝试自己编译一下，预编译版兼容性不是很强

好的，谢谢付老师~

作者
Author: Azrael 时间: 2024-5-20 10:06

fhh2626 发表于 2021-3-12 16:55
不过如果你要用Colvars的功能的话还是只能跑传统版本的

付老师，学生在尝试您的BFEE2，GPU没有跑满，您昨天建议我预编译一下。

但是我用到了Colvars功能，看您这条消息是只能用传统版本。

请问传统版本是在官网下载source dode编译还是去gitlab下载MAIN版本编译呢？

作者
Author: fhh2626 时间: 2024-5-20 10:26

Azrael 发表于 2024-5-20 10:06
付老师，学生在尝试您的BFEE2，GPU没有跑满，您昨天建议我预编译一下。

但是我用到了Colvars功能，看 ...

那条消息过时了，现在最新版本也支持Colvars了。
你试试用3.0b7，在配置文件里面加上CUDASOAintegrate on就行

作者
Author: Azrael 时间: 2024-5-20 10:40

fhh2626 发表于 2024-5-20 10:26
那条消息过时了，现在最新版本也支持Colvars了。
你试试用3.0b7，在配置文件里面加上CUDASOAintegrate ...

付老师，我前天在该贴的消息您可能没细看，只是建议我编译下，我再重复一遍哈：

”付老师您好，我用的是3.0b7版本NAMD3，namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log &跑起来没问题；

在configure文件里面加上cudasoaintegrate on，CPU改为 1 ，

运行namd3 +p1 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & 就会报错

FATAL ERROR: CUDA error cudaStreamSynchronize(stream) in file src/CudaTileListKernel.cu, function buildTileLists, line 1141 on Pe 0 (rocky9 device 1 pci 0:3b:0): an illegal memory access was encountered

请问可能是什么原因呢“

我具体的版本是NAMD_3.0b7_Linux-x86_64-netlrts-smp-CUDA.tar，您看是不是得把cudasoaintegrate 换成CUDASOAintegrate这个报错就可以解决，或者BFEE2需要换个版本？还是需要编译呢？

学生觉得您的BFEE2非常牛逼，希望在自己的文章中引用，但是目前显卡没跑满导致效率很低，恳请您指正！

作者
Author: fhh2626 时间: 2024-5-20 11:46

Azrael 发表于 2024-5-20 10:40
付老师，我前天在该贴的消息您可能没细看，只是建议我编译下，我再重复一遍哈：

”付老师您好，我用的 ...

试试这个版本呢：
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

作者
Author: Azrael 时间: 2024-5-20 12:07

fhh2626 发表于 2024-5-20 11:46
试试这个版本呢：
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

好的，谢谢付老师

作者
Author: Azrael 时间: 2024-5-20 16:04
本帖最后由 Azrael 于 2024-5-21 09:21 编辑

fhh2626 发表于 2024-5-20 11:46
试试这个版本呢：
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

付老师，我用了Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)，GPU使用率确实提升上来了, 万分感谢！！1

欢迎光临计算化学公社 (http://bbs.keinsci.com/)