计算化学公社

 找回密码 Forget password
 注册 Register
Views: 7541|回复 Reply: 22
打印 Print 上一主题 Last thread 下一主题 Next thread

[GPU加速] namd对GPU利用率很低

[复制链接 Copy URL]

22

帖子

0

威望

213

eV
积分
235

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 yl233 于 2021-3-12 16:50 编辑

向各位请教一下,namd对CPU的依赖性很强吗?使用GPU加速的namd,在4-16个核的情况下,对一块GPU的利用率只有8%-50%,这是为什么呢?

WechatIMG34.png (21.69 KB, 下载次数 Times of downloads: 251)

WechatIMG34.png

WechatIMG30.png (68.23 KB, 下载次数 Times of downloads: 234)

WechatIMG30.png

38

帖子

0

威望

345

eV
积分
383

Level 3 能力者

23#
发表于 Post on 2024-5-20 16:04:08 | 只看该作者 Only view this author
本帖最后由 Azrael 于 2024-5-21 09:21 编辑
fhh2626 发表于 2024-5-20 11:46
试试这个版本呢:
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

付老师, 我用了Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration),GPU使用率确实提升上来了, 万分感谢 !!1
命数如织,当为磐石

38

帖子

0

威望

345

eV
积分
383

Level 3 能力者

22#
发表于 Post on 2024-5-20 12:07:47 | 只看该作者 Only view this author
fhh2626 发表于 2024-5-20 11:46
试试这个版本呢:
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

好的,谢谢付老师
命数如织,当为磐石

1149

帖子

6

威望

6629

eV
积分
7898

Level 6 (一方通行)

21#
发表于 Post on 2024-5-20 11:46:13 | 只看该作者 Only view this author
Azrael 发表于 2024-5-20 10:40
付老师,我前天在该贴的消息您可能没细看,只是建议我编译下,我再重复一遍哈:

”付老师您好,我用的 ...

试试这个版本呢:
Linux-x86_64-multicore-CUDA (NVIDIA CUDA acceleration)

38

帖子

0

威望

345

eV
积分
383

Level 3 能力者

20#
发表于 Post on 2024-5-20 10:40:47 | 只看该作者 Only view this author
fhh2626 发表于 2024-5-20 10:26
那条消息过时了,现在最新版本也支持Colvars了。
你试试用3.0b7,在配置文件里面加上CUDASOAintegrate   ...

付老师,我前天在该贴的消息您可能没细看,只是建议我编译下,我再重复一遍哈:

”付老师您好,我用的是3.0b7版本NAMD3,namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log &跑起来没问题;

在configure文件里面加上cudasoaintegrate   on,CPU改为 1 ,

运行namd3 +p1 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & 就会报错

FATAL ERROR: CUDA error cudaStreamSynchronize(stream) in file src/CudaTileListKernel.cu, function buildTileLists, line 1141 on Pe 0 (rocky9 device 1 pci 0:3b:0): an illegal memory access was encountered

请问可能是什么原因呢“

我具体的版本是NAMD_3.0b7_Linux-x86_64-netlrts-smp-CUDA.tar,您看是不是得把cudasoaintegrate 换成CUDASOAintegrate这个报错就可以解决,或者BFEE2需要换个版本?还是需要编译呢?

学生觉得您的BFEE2非常牛逼,希望在自己的文章中引用,但是目前显卡没跑满导致效率很低,恳请您指正 !
命数如织,当为磐石

1149

帖子

6

威望

6629

eV
积分
7898

Level 6 (一方通行)

19#
发表于 Post on 2024-5-20 10:26:38 | 只看该作者 Only view this author
Azrael 发表于 2024-5-20 10:06
付老师,学生在尝试您的BFEE2,GPU没有跑满,您昨天建议我预编译一下。

但是我用到了Colvars功能,看 ...

那条消息过时了,现在最新版本也支持Colvars了。
你试试用3.0b7,在配置文件里面加上CUDASOAintegrate  on就行

38

帖子

0

威望

345

eV
积分
383

Level 3 能力者

18#
发表于 Post on 2024-5-20 10:06:14 | 只看该作者 Only view this author
fhh2626 发表于 2021-3-12 16:55
不过如果你要用Colvars的功能的话还是只能跑传统版本的

付老师,学生在尝试您的BFEE2,GPU没有跑满,您昨天建议我预编译一下。

但是我用到了Colvars功能,看您这条消息是只能用传统版本。

请问传统版本是在官网下载source dode编译还是去gitlab下载MAIN版本编译呢?

202405201005385531..png (141.12 KB, 下载次数 Times of downloads: 151)

202405201005385531..png

NAMD3.png (147.72 KB, 下载次数 Times of downloads: 155)

NAMD3.png
命数如织,当为磐石

38

帖子

0

威望

345

eV
积分
383

Level 3 能力者

17#
发表于 Post on 2024-5-19 22:47:50 | 只看该作者 Only view this author
fhh2626 发表于 2024-5-18 14:03
可以尝试自己编译一下,预编译版兼容性不是很强

好的,谢谢付老师~
命数如织,当为磐石

1149

帖子

6

威望

6629

eV
积分
7898

Level 6 (一方通行)

16#
发表于 Post on 2024-5-18 14:03:58 | 只看该作者 Only view this author
Azrael 发表于 2024-5-18 10:30
付老师您好,我用的是3.0b7版本NAMD3,namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & ...

可以尝试自己编译一下,预编译版兼容性不是很强

38

帖子

0

威望

345

eV
积分
383

Level 3 能力者

15#
发表于 Post on 2024-5-18 10:30:36 | 只看该作者 Only view this author
fhh2626 发表于 2024-3-28 10:13
下最新版(3.0b6),在configure文件里面加上cudasoaintegrate   on,CPU只给一个核,利用率就会变高

付老师您好,我用的是3.0b7版本NAMD3,namd3 +p20 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log &跑起来没问题;
在configure文件里面加上cudasoaintegrate   on,CPU改为一运行namd3 +p1 +idlepoll +devices 1 000.1_eq.conf > 000.1_eq.log & 就会报错FATAL ERROR: CUDA error cudaStreamSynchronize(stream) in file src/CudaTileListKernel.cu, function buildTileLists, line 1141
on Pe 0 (rocky9 device 1 pci 0:3b:0): an illegal memory access was encountered
,请问可能是什么原因呢
命数如织,当为磐石

1149

帖子

6

威望

6629

eV
积分
7898

Level 6 (一方通行)

14#
发表于 Post on 2024-4-11 11:22:58 | 只看该作者 Only view this author
DwyaneWan 发表于 2024-4-11 10:39
那fu老师,如果在conf中加入了wrap 所有分子 会影响速度吗

不会

66

帖子

0

威望

1244

eV
积分
1310

Level 4 (黑子)

13#
发表于 Post on 2024-4-11 10:39:37 | 只看该作者 Only view this author
fhh2626 发表于 2024-3-28 10:13
下最新版(3.0b6),在configure文件里面加上cudasoaintegrate   on,CPU只给一个核,利用率就会变高

那fu老师,如果在conf中加入了wrap 所有分子 会影响速度吗

1149

帖子

6

威望

6629

eV
积分
7898

Level 6 (一方通行)

12#
发表于 Post on 2024-3-28 10:13:34 | 只看该作者 Only view this author
DwyaneWan 发表于 2024-3-27 23:59
老师你好,我使用了colvars之后,gpu占用率16%,cpu给的越多,速度也没见提升很多呢。 这个正常吗

下最新版(3.0b6),在configure文件里面加上cudasoaintegrate   on,CPU只给一个核,利用率就会变高

66

帖子

0

威望

1244

eV
积分
1310

Level 4 (黑子)

11#
发表于 Post on 2024-3-27 23:59:05 | 只看该作者 Only view this author
fhh2626 发表于 2021-3-12 16:54
https://gitlab.com/tcbgUIUC/namd/-/tree/devel

下devel分支,并且编译--with-single-cuda版本

老师你好,我使用了colvars之后,gpu占用率16%,cpu给的越多,速度也没见提升很多呢。 这个正常吗

1149

帖子

6

威望

6629

eV
积分
7898

Level 6 (一方通行)

10#
发表于 Post on 2023-7-20 12:07:01 | 只看该作者 Only view this author
Amphibiouskii 发表于 2023-7-19 17:20
我也遇到了这个问题,GPU的占用率只有40%左右,不过使用了colvars,是使用colvars功能了就会这样吗?还是 ...

使用了Colvars就是这样

不用的话,加上CUDASOAIntegrate   on,GPU利用率可以达到99%

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-14 01:06 , Processed in 0.244421 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list