计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2479|回复 Reply: 11
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] 请教一个四万个原子(包含水)的MD大概需要运行多久?

[复制链接 Copy URL]

20

帖子

0

威望

155

eV
积分
175

Level 3 能力者

各位老师,打扰了,请教一个问题,以确定我软件安装或者设置没问题。之前我跑了一个蛋白体系,一共包含4万个原子,最后租了一个3090来跑,200ns花费了10个小时。想要继续延长时间,我就在公共的电脑上安装了gromacs,有两个4090显卡。但是在运行的时候,提示结束时间要到六个月后了。。。。。这种情况应该是我设置的有问题吗?在mdrun的时候没有提示“WARNING: Using the slow plain C kernels. This should not happen during routine usage on supported platforms”


如果问题不合适,还请见谅

Snipaste_2023-12-20_17-13-09.png (210.97 KB, 下载次数 Times of downloads: 35)

Snipaste_2023-12-20_17-13-09.png

2

帖子

0

威望

1755

eV
积分
1757

Level 5 (御坂)

2#
发表于 Post on 2023-12-21 00:19:42 | 只看该作者 Only view this author
笔记本端 4060  3.8W原子 Linux gromacs2022.06 280ns/day

6万

帖子

99

威望

6万

eV
积分
125153

管理员

公社社长

3#
发表于 Post on 2023-12-21 03:36:22 | 只看该作者 Only view this author
弄清楚到底GPU加速利用了没有

并且跑半分钟后杀掉,看速度统计每天能跑多少ns
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

20

帖子

0

威望

155

eV
积分
175

Level 3 能力者

4#
 楼主 Author| 发表于 Post on 2023-12-21 09:24:19 | 只看该作者 Only view this author
sobereva 发表于 2023-12-21 03:36
弄清楚到底GPU加速利用了没有

并且跑半分钟后杀掉,看速度统计每天能跑多少ns

感谢老师的回复!
我看了刚刚运行mdrun的提示如下
“On host cryo 2 GPUs selected for this run.
Mapping of GPU IDs to the 8 GPU tasks in the 8 ranks on this node:
  PP:0,PP:0,PP:0,PP:0,PP:1,PP:1,PP:1,PP:1
PP tasks will do (non-perturbed) short-ranged and most bonded interactions on the GPU
PP task will update and constrain coordinates on the CPU
Using 8 MPI threads
Using 6 OpenMP threads per tMPI thread”

应该是调用了GPU加速了吧

20

帖子

0

威望

155

eV
积分
175

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2023-12-21 09:44:46 | 只看该作者 Only view this author
sobereva 发表于 2023-12-21 03:36
弄清楚到底GPU加速利用了没有

并且跑半分钟后杀掉,看速度统计每天能跑多少ns

感觉跑的还是很慢吧
               Core t (s)   Wall t (s)        (%)
       Time:    29654.310      617.817     4799.9
                 (ns/day)    (hour/ns)
Performance:        5.818        4.125

455

帖子

1

威望

2929

eV
积分
3404

Level 5 (御坂)

6#
发表于 Post on 2023-12-21 09:45:53 | 只看该作者 Only view this author
说清你的CPU型号。
4090不支持NVLink,恐怕不适合两张显卡跑一个任务。如果CPU带得动,应该用两张卡分别各跑一个任务,适当设定线程绑定,每个任务应该是-ntmpi 1 -ntomp xxx,xxx代表并行核数。用GPU版本如果不跨显卡跑任务,通常thread-MPI或者MPI的数量都应该设为1。

20

帖子

0

威望

155

eV
积分
175

Level 3 能力者

7#
 楼主 Author| 发表于 Post on 2023-12-21 09:51:58 | 只看该作者 Only view this author
snljty2 发表于 2023-12-21 09:45
说清你的CPU型号。
4090不支持NVLink,恐怕不适合两张显卡跑一个任务。如果CPU带得动,应该用两张卡分别各 ...

感谢您的回复,CPU是Intel(R) Xeon(R) Gold 5318Y CPU @ 2.10GHz,也在论坛中找了一下,发现之前默认-ntmpi 弄成了8个  现在使用命令-ntmpi 1 -ntomp 24来运行,现在好像速度快了很多;此外,学习了“GROMACS (2019.3 GPU版) 并行效率测试及调试思路”,这个发现我之前mdrun的命令中只写了 -nb gpu,现在还加上了-pme gpu,不知道是否也是影响了速度。

再次对您的回复表示感谢,学习到了很多东西。

455

帖子

1

威望

2929

eV
积分
3404

Level 5 (御坂)

8#
发表于 Post on 2023-12-21 10:26:36 | 只看该作者 Only view this author
本帖最后由 snljty2 于 2023-12-21 11:33 编辑
Newbee_Ccc 发表于 2023-12-21 09:51
感谢您的回复,CPU是Intel(R) Xeon(R) Gold 5318Y CPU @ 2.10GHz,也在论坛中找了一下,发现之前默认-ntm ...

这种CPU单核频率等因素不行,会明显拖累4090的速度。如果条件允许,建议参考Entropy.S.I的文章《性能翻倍?RTX4090科学计算之经典MD模拟全面测试》《2023年3月MD benchmark测试中篇 ——W790平台首发测试》,重配一台更合理搭配的服务器。另外追求速度的话,应该用尽量新的稳定版本的Gromacs,建议用不晚于2022.6的版本。
通常编译参数、运行参数等合理而且所用任务支持的话,-pme gpu是默认的。建议使用Linux系统,设定好内核绑定,并且考虑好主板上电路连接方式,让所选用CPU核心和用的对应的GPU是直连的。没有作业系统的话,用-gpu_id参数指定需要的GPU的ID,用-pin on -ntmpi 1 -ntomp xxx -pinoffset yyy指定CPU数量和内核绑定的起始位置。通常CPU不太烂的话,最优参数一般是-bonded cpu -nb gpu -pme gpu -update gpu。

878

帖子

17

威望

5439

eV
积分
6657

Level 6 (一方通行)

小屁孩

9#
发表于 Post on 2023-12-21 11:20:34 | 只看该作者 Only view this author
snljty2 发表于 2023-12-21 10:26
这种CPU单核频率等因素不行,会明显拖累4090的速度。如果条件允许,建议参考Entropy.S.I的文章《性能翻倍 ...

是-bonded cpu -update gpu
而非-bonded cpu -nb gpu -pme gpu
- 向着虚无前进 -

878

帖子

17

威望

5439

eV
积分
6657

Level 6 (一方通行)

小屁孩

10#
发表于 Post on 2023-12-21 11:22:29 | 只看该作者 Only view this author
本帖最后由 Entropy.S.I 于 2023-12-21 11:26 编辑

用完全没有调优的简单粗暴的命令提交,只会自取其辱。必须认真学习gmx mdrun的并行调优。2019年的已经过时了。

对于你当前这种单核性能一塌糊涂的CPU,-bonded gpu或许更好,实际自行测试。但再怎么调优,预计最大性能只有13900KF+4090的不到80%,你的4090只能当4080用。

做benchmark必须关闭pme tuning,并通过-nsteps设置较少的步数,前者对结果的影响绝对不可忽视。
- 向着虚无前进 -

20

帖子

0

威望

155

eV
积分
175

Level 3 能力者

11#
 楼主 Author| 发表于 Post on 2023-12-21 15:30:34 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-12-21 11:22
用完全没有调优的简单粗暴的命令提交,只会自取其辱。必须认真学习gmx mdrun的并行调优。2019年的已经过时 ...

感谢指导,会继续学习的

455

帖子

1

威望

2929

eV
积分
3404

Level 5 (御坂)

12#
发表于 Post on 2024-1-5 14:27:56 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-12-21 11:20
是-bonded cpu -update gpu
而非-bonded cpu -nb gpu -pme gpu

不好意思忘了提醒了,多谢指正,我环境变量加了export GMX_FORCE_UPDATE_DEFAULT_GPU=true,就忘了没做的话还要设置-update gpu这件事啦。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-23 21:51 , Processed in 0.347909 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list