计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2294|回复 Reply: 7
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] 求助:2023版gromacs使用4090显卡低功耗,低性能的问题

[复制链接 Copy URL]

6

帖子

0

威望

109

eV
积分
115

Level 2 能力者

本帖最后由 Zbin 于 2023-7-11 11:12 编辑

我利用4090显卡(CPU:AMD EPYC 7763)利用gromacs进行MD模拟,发现运算速度和3090一样(相同体系和参数设置),并没有很大提升。以下是MD模拟的运行命令。
  1. gmx mdrun -v -deffnm md  -ntmpi 1 -ntomp 8 -gpu_id 0 -pin on -pinoffset 0 -update gpu
复制代码
以下是gromacs编译的信息:
  1. GROMACS version:    2023
  2. Precision:          mixed
  3. Memory model:       64 bit
  4. MPI library:        thread_mpi
  5. OpenMP support:     enabled (GMX_OPENMP_MAX_THREADS = 128)
  6. GPU support:        CUDA
  7. NB cluster size:    8
  8. SIMD instructions:  AVX2_256
  9. CPU FFT library:    fftw-3.3.8-sse2-avx-avx2-avx2_128
  10. GPU FFT library:    cuFFT
  11. Multi-GPU FFT:      none
  12. RDTSCP usage:       enabled
  13. TNG support:        enabled
  14. Hwloc support:      disabled
  15. Tracing support:    disabled
  16. C compiler:         /usr/bin/cc GNU 11.3.0
  17. C compiler flags:   -fexcess-precision=fast -funroll-all-loops -mavx2 -mfma -Wno-missing-field-initializers -O3 -DNDEBUG
  18. C++ compiler:       /usr/bin/c++ GNU 11.3.0
  19. C++ compiler flags: -fexcess-precision=fast -funroll-all-loops -mavx2 -mfma -Wno-missing-field-initializers -Wno-cast-function-type-strict -fopenmp -O3 -DNDEBUG
  20. BLAS library:      
  21. LAPACK library:     
  22. CUDA compiler:      /usr/local/cuda/bin/nvcc nvcc: NVIDIA (R) Cuda compiler driver;Copyright (c) 2005-2022 NVIDIA Corporation;Built on Mon_Oct_24_19:12:58_PDT_2022;Cuda compilation tools, release 12.0, V12.0.76;Build cuda_12.0.r12.0/compiler.31968024_0
  23. CUDA compiler flags:-std=c++17;--generate-code=arch=compute_50,code=sm_50;--generate-code=arch=compute_52,code=sm_52;--generate-code=arch=compute_60,code=sm_60;--generate-code=arch=compute_61,code=sm_61;--generate-code=arch=compute_70,code=sm_70;--generate-code=arch=compute_75,code=sm_75;--generate-code=arch=compute_80,code=sm_80;--generate-code=arch=compute_86,code=sm_86;--generate-code=arch=compute_89,code=sm_89;--generate-code=arch=compute_90,code=sm_90;-Wno-deprecated-gpu-targets;--generate-code=arch=compute_53,code=sm_53;--generate-code=arch=compute_80,code=sm_80;-use_fast_math;-Xptxas;-warn-double-usage;-Xptxas;-Werror;-D_FORCE_INLINES;-fexcess-precision=fast -funroll-all-loops -mavx2 -mfma -Wno-missing-field-initializers -Wno-cast-function-type-strict -fopenmp -O3 -DNDEBUG
  24. CUDA driver:        12.0
  25. CUDA runtime:       12.20
复制代码
这是模拟中GPU占用率:



我使用其他软件可以将4090的功耗利用到450W(几乎占满)。
目前不清楚这种现象的原因,大家有什么解决方案吗?

878

帖子

17

威望

5403

eV
积分
6621

Level 6 (一方通行)

小屁孩

8#
发表于 Post on 2025-1-3 15:29:11 | 只看该作者 Only view this author
youknowdcf 发表于 2025-1-3 14:36
大佬请问一下,现在可用作生产模拟的gromac gpu加速版选哪个好些?我目前用的还是2019.3,感觉有些落后了 ...

2023.5或2024.4,取决于你是否需要2024的feature
- 向着虚无前进 -

50

帖子

0

威望

966

eV
积分
1016

Level 4 (黑子)

7#
发表于 Post on 2025-1-3 14:36:45 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-7-11 13:35
CPU用EPYC 7763,本来就没什么救,在这种CPU下把4090当4080用即可。谁让你买单核性能一塌糊涂的7763呢,看 ...

大佬请问一下,现在可用作生产模拟的gromac gpu加速版选哪个好些?我目前用的还是2019.3,感觉有些落后了。

6

帖子

0

威望

109

eV
积分
115

Level 2 能力者

6#
 楼主 Author| 发表于 Post on 2023-7-12 10:56:33 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-7-11 13:35
CPU用EPYC 7763,本来就没什么救,在这种CPU下把4090当4080用即可。谁让你买单核性能一塌糊涂的7763呢,看 ...

感谢,加了-bonded gpu后可以与5950/13900+4090基本打平,速度满足需求。另外,这种配置主要也平衡pytorch的多卡使用,并不完全做MD。

878

帖子

17

威望

5403

eV
积分
6621

Level 6 (一方通行)

小屁孩

5#
发表于 Post on 2023-7-11 13:35:45 | 只看该作者 Only view this author
CPU用EPYC 7763,本来就没什么救,在这种CPU下把4090当4080用即可。谁让你买单核性能一塌糊涂的7763呢,看了我文章还买这种CPU,只能尊重祝福了。

先用nvidia-smi -q看看PCIe连接在什么速率,再尝试-bonded gpu。正常来说使用-bonded gpu后4090相较于3090速度至少有90%提升,当然,你这CPU也不能奢求太多,即使-bonded gpu估计也就70~80%。
- 向着虚无前进 -

1557

帖子

0

威望

4953

eV
积分
6510

Level 6 (一方通行)

4#
发表于 Post on 2023-7-11 12:56:07 | 只看该作者 Only view this author
本帖最后由 牧生 于 2023-7-11 12:58 编辑

http://bbs.keinsci.com/thread-37587-1-1.html

从第七楼开始往下看,看你是不是一样的
又菜又爱玩

6

帖子

0

威望

109

eV
积分
115

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2023-7-11 11:44:20 | 只看该作者 Only view this author
dzdhp 发表于 2023-7-11 11:39
http://bbs.keinsci.com/forum.php?mod=viewthread&tid=33296&highlight=4090
你看看这位老师的测试

这个帖子我们很早就关注了,但并不能解决出现的问题

146

帖子

0

威望

1583

eV
积分
1729

Level 5 (御坂)

2#
发表于 Post on 2023-7-11 11:39:06 | 只看该作者 Only view this author
由衷感谢每位帮助我的好心人

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-25 19:50 , Processed in 0.204113 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list