计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: ggdh
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] GROMACS (2019.3 GPU版) 并行效率测试及调试思路

  [复制链接 Copy URL]

1187

帖子

5

威望

2841

eV
积分
4129

Level 6 (一方通行)

46#
发表于 Post on 2022-3-5 00:00:08 | 只看该作者 Only view this author
lanthanum 发表于 2022-3-4 23:16
gmx mdrun -ntmpi 1 -ntomp 12 -gpu_id 0 -s abc.tpr  #使用0号gpu计算abc.tpr
gmx mdrun -ntmpi 1 -ntomp ...

不是cpu_id,是用-pinoffset。结合htop命令,试一下这个参数怎么用即可。

846

帖子

16

威望

4632

eV
积分
5798

Level 6 (一方通行)

小屁孩

47#
发表于 Post on 2022-3-5 02:38:05 | 只看该作者 Only view this author
lanthanum 发表于 2022-3-4 23:16
gmx mdrun -ntmpi 1 -ntomp 12 -gpu_id 0 -s abc.tpr  #使用0号gpu计算abc.tpr
gmx mdrun -ntmpi 1 -ntomp ...

最近要公布的一个gmx自动运行小脚本,其中对并行参数定义的解释,参考:

  1. md_nt='32'      # Number of threads used when running mdrun (excluding 'em' and 'rerun'). It cannot be greater than the number of CPU logical cores of the current host.
  2. multi_gpu='0'   # Whether to use multiple GPUs to run 1 mdrun task (excluding 'em' and 'rerun'). If enabled, the 'md_nt' option will be ignored.
  3.     ntmpi='8'   # Number of MPI threads (RANKs) used when running 1 mdrun task with multiple GPUs.
  4.     ntomp='6'   # Number of OpenMP threads used when running 1 mdrun task with multiple GPUs. The value of [ntmpi*ntomp] cannot be greater than the number of CPU logical cores of the current host. It is generally not recommended to use the extra logical cores obtained by Hyper Threading (HT) technology.
  5.     gputasks='' # MPI RANKs of each GPU. When this option is enabled at the same time as 'gpu_id', this option will be ignored. Note: the last RANK is PME RANK and the rest are PP RANKs. This option can be used for manual control of GPU load balancing, for example: ntmpi=8, gputasks=00000111, means The first 5 RANKs run with GPU 0, and the last 3 RANKs run with GPU 1.
  6. gpu_id='0'      # ID of GPU which used in MD simulation tasks。If more than 1 is used, write out the GPU IDs side by side. For example, '01'. Note: if the current host has multiple GPUs with different architectures, the GPU ID detected by GMX may not be consistent with the GPU ID in the GPU driver, instead, it is sorted by the value of "compute_cap" from large to small according to the "fastest first" rule.
  7. update_gpu='1'  # Whether to add the '-update gpu' option in mdrun (excluding 'em' and 'rerun') command when running 1 mdrun task with 1 GPU. This option is not supported if a 4-point water model is used.
  8. pinoffset='0'   # Value of '-pinoffset' option in mdrun (including 'em' and 'rerun') command, default value is 0. When you need to run 2 or more GMX tasks in parallel in the current host, you can define other values by yourself. For example, in a host with dual 24c&48t CPUs and dual GPUs, for task 1: md_nt=24, multi_gpu=0, gpu_id=0, pinoffset=0; for task 2: md_nt=24, multi_gpu=0, gpu_id=1, pinoffset=48.
  9. pinstride='0'   # Value of '-pinstride' option in mdrun (including 'em' and 'rerun') command, default value is 0, GMX will determine the appropriate value by itself. If there are no special requirements, it is strongly recommended not to change this option to other values!
复制代码
- 向着虚无前进 -

68

帖子

0

威望

3445

eV
积分
3513

Level 5 (御坂)

48#
发表于 Post on 2022-3-5 21:16:36 | 只看该作者 Only view this author
snljty 发表于 2022-3-5 00:00
不是cpu_id,是用-pinoffset。结合htop命令,试一下这个参数怎么用即可。

谢谢。

68

帖子

0

威望

3445

eV
积分
3513

Level 5 (御坂)

49#
发表于 Post on 2022-3-5 21:17:39 | 只看该作者 Only view this author
Entropy.S.I 发表于 2022-3-5 02:38
最近要公布的一个gmx自动运行小脚本,其中对并行参数定义的解释,参考:

谢谢。

2

帖子

0

威望

15

eV
积分
17

Level 1 能力者

50#
发表于 Post on 2022-3-17 23:16:23 | 只看该作者 Only view this author
谢谢!解决大问题!

6

帖子

0

威望

39

eV
积分
45

Level 2 能力者

51#
发表于 Post on 2022-4-15 09:30:47 | 只看该作者 Only view this author
请问老师,昨天按照知乎上的教程安装了GMX2020的版本,当时没有添加 =GPU,可以安装后添加吗 ?还是需要重新安装一次 ?

1376

帖子

0

威望

3984

eV
积分
5360

Level 6 (一方通行)

52#
发表于 Post on 2022-4-15 09:39:03 | 只看该作者 Only view this author
panyongcai 发表于 2022-4-15 09:30
请问老师,昨天按照知乎上的教程安装了GMX2020的版本,当时没有添加 =GPU,可以安装后添加吗 ?还是需要重 ...

重新在cmake那一步进行就可以了,也不过就几分钟罢了
又菜又爱玩

6

帖子

0

威望

39

eV
积分
45

Level 2 能力者

53#
发表于 Post on 2022-4-18 09:51:04 | 只看该作者 Only view this author
牧生 发表于 2022-4-15 09:39
重新在cmake那一步进行就可以了,也不过就几分钟罢了

谢谢。

1

帖子

0

威望

15

eV
积分
16

Level 1 能力者

54#
发表于 Post on 2022-8-21 10:46:58 | 只看该作者 Only view this author
你好,请问我用-nb gpu无法调用GPU该怎么解决,提示Nonbonded interactions on the GPU were required, but not supported for these
simulation settings. Change your settings, or do not require using GPUs.

3

帖子

0

威望

11

eV
积分
14

Level 1 能力者

55#
发表于 Post on 2022-8-31 14:18:00 | 只看该作者 Only view this author
本帖最后由 Timeless 于 2022-8-31 14:21 编辑

请问大家有没有遇到,单个服务器上同时运行多个gmx任务时,出现任务之间抢占cpu的现象,最后每个任务使用的cpu数量会降为原来的一半,最后每个任务的速度都会下降(服务器cpu未使用完),需要添加什么参数让每个任务以cpu独占的方式运行吗?运行命令如下:
gmx mdrun -deffnm md_0_10 -gpu_id 1 -v -nb gpu -pin on -bonded gpu -ntmpi 1 -nt 4 -pme gpu

3

帖子

0

威望

11

eV
积分
14

Level 1 能力者

56#
发表于 Post on 2022-8-31 15:21:05 | 只看该作者 Only view this author
Timeless 发表于 2022-8-31 14:18
请问大家有没有遇到,单个服务器上同时运行多个gmx任务时,出现任务之间抢占cpu的现象,最后每个任务使用的 ...

问题已解决。

33

帖子

0

威望

169

eV
积分
202

Level 3 能力者

57#
发表于 Post on 2023-2-23 08:22:48 | 只看该作者 Only view this author

请问怎么解决的啊?我也遇到了同样的问题。我是双显卡,任务之间总是相互影响。

33

帖子

0

威望

169

eV
积分
202

Level 3 能力者

58#
发表于 Post on 2023-2-23 09:34:46 | 只看该作者 Only view this author
wasngsimin 发表于 2023-2-23 08:22
请问怎么解决的啊?我也遇到了同样的问题。我是双显卡,任务之间总是相互影响。

解决了:http://bbs.keinsci.com/thread-25510-1-1.html

1

帖子

0

威望

79

eV
积分
80

Level 2 能力者

59#
发表于 Post on 2023-4-26 22:15:16 | 只看该作者 Only view this author
老师们遇到过1 ranks报错的情况没,gromacs2022.5,从2020 -ntmpi 1 -ntomp 8妥妥运行

23

帖子

0

威望

619

eV
积分
642

Level 4 (黑子)

60#
发表于 Post on 2023-5-23 14:21:41 | 只看该作者 Only view this author
楼主你好,感谢分享,请问我的输出结果是这样的,测试结果对比之前我使用 gmx mdrun -deffnm md -nb gpu -update gpu的速度要快5%,一天能多跑15ns,想请问改如何根据测试结果取对应修改mdrun指令?

202305231419458506..png (82.97 KB, 下载次数 Times of downloads: 44)

202305231419458506..png

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 00:45 , Processed in 0.203547 second(s), 29 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list