计算化学公社

 找回密码 Forget password
 注册 Register
Views: 102|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] 跑GPU加速版的GMX时GPU的利用率很低

[复制链接 Copy URL]

23

帖子

0

威望

178

eV
积分
201

Level 3 能力者

    各位老师好,我最近在跑一个约53000个原子的有机小分子体系,但是我发现在跑gmx时候gpu的利用率很低,仅为13%左右,同时cpu的利用率90%-95%,gpu的利用率太低了,比之前跑模拟效率还低(之前约45%),而运行命令是没变的,不知道是哪里出现了问题?

我试图在b站搜索了一些视频,也在本站搜索了相关帖子,但不是无济于事就是看不懂描述,作为一个电脑小白真的不知道哪里出现了问题,又该从哪里入手解决,恳求各位大佬出手相助~

我电脑的配置如下:CPU/显卡:13thGenIntel(R)Core(TM)i7-13700F//NVIDIA GeForce RTX 4070Ti
运行命令如下:gmx mdrun -deffnm ** -v -c **.gro -gpu_id 0 -nb gpu -bonded gpu -pme gpu -pmefft gpu -ntmpi 1 -ntomp 8 -pin on
运行效率:114ns/day
GMX版本:gmx2020.6_GPU
.mdp文件见附件
截取的.log文件中的内容
1 GPU selected for this run.
Mapping of GPU IDs to the 2 GPU tasks in the 1 rank on this node:
  PP:0,PME:0
PP tasks will do (non-perturbed) short-ranged and most bonded interactions on the GPU
PP task will update and constrain coordinates on the CPU
PME tasks will do all aspects on the GPU
Using 1 MPI thread
Using 8 OpenMP threads


eq.mdp

715 Bytes, 下载次数 Times of downloads: 2

163

帖子

0

威望

738

eV
积分
901

Level 4 (黑子)

终身学习

2#
发表于 Post on 2024-11-8 16:08:26 | 只看该作者 Only view this author
命令里加上 -update gpu,这一项也是GPU加速的大头。追求更快的速度用更新的gromacs版本
另外5w原子体系不算大,跑不满4070ti也是正常的
Open source enables open science.

23

帖子

0

威望

178

eV
积分
201

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2024-11-8 18:33:02 | 只看该作者 Only view this author
谢谢你的回复,可是我加了-updated gpu之后运行效率变快了(166ns/day),但是gpu的占用率却变小了(仅为6%),这又是为什么呢?

163

帖子

0

威望

738

eV
积分
901

Level 4 (黑子)

终身学习

4#
发表于 Post on 2024-11-8 21:02:19 | 只看该作者 Only view this author
niumx 发表于 2024-11-8 18:33
谢谢你的回复,可是我加了-updated gpu之后运行效率变快了(166ns/day),但是gpu的占用率却变小了(仅为6 ...

用什么方法看的占用率。任务管理器可能是不准确的,命令行窗口用nvidia-smi看看
Open source enables open science.

23

帖子

0

威望

178

eV
积分
201

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2024-11-8 21:50:13 | 只看该作者 Only view this author
谢谢你,原来还有这个方法。请问我圈起来的数字是代表gpu的利用率吗?

屏幕截图 2024-11-08 214826.jpg (305.83 KB, 下载次数 Times of downloads: 0)

屏幕截图 2024-11-08 214826.jpg

163

帖子

0

威望

738

eV
积分
901

Level 4 (黑子)

终身学习

6#
发表于 Post on 2024-11-9 00:20:33 | 只看该作者 Only view this author
本帖最后由 Seyilaxa 于 2024-11-9 00:22 编辑
niumx 发表于 2024-11-8 21:50
谢谢你,原来还有这个方法。请问我圈起来的数字是代表gpu的利用率吗?

是的,现在计算的瓶颈来源于CPU,所以应当增加分配的核数
Open source enables open science.

5万

帖子

99

威望

5万

eV
积分
112349

管理员

公社社长

7#
发表于 Post on 2024-11-9 06:49:56 | 只看该作者 Only view this author
参考北京科音分子动力学与GROMACS培训班(http://www.keinsci.com/KGMX)的ppt:


另外,注重性能的话建议用Linux版
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

23

帖子

0

威望

178

eV
积分
201

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2024-11-9 08:23:01 | 只看该作者 Only view this author
Seyilaxa 发表于 2024-11-9 00:20
是的,现在计算的瓶颈来源于CPU,所以应当增加分配的核数

好的,我明白了,非常感谢~

23

帖子

0

威望

178

eV
积分
201

Level 3 能力者

9#
 楼主 Author| 发表于 Post on 2024-11-9 08:23:35 | 只看该作者 Only view this author
sobereva 发表于 2024-11-9 06:49
参考北京科音分子动力学与GROMACS培训班(http://www.keinsci.com/KGMX)的ppt:

谢谢sob老师回复,我明白了~

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 01:15 , Processed in 0.195445 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list