“第10届量子化学波函数分析与Multiwfn程序培训班将于5月4-8日于北京举办,这是一次性完整、系统学习波函数分析的各种理论知识和全面掌握强大的Multiwfn波函数分析程序使用的最不可错过的机会!请点击此链接查看详情和报名方式,欢迎参加!

“第18届北京科音分子动力学与GROMACS培训班” 将于5月23-26日于北京举办。这是一次性全面、系统学习分子动力学模拟知识和最流行的分子动力学程序GROMACS的关键机会!报名正在进行中,请点击此链接查看详情,欢迎参加!

计算化学公社

 找回密码 Forget password
 注册 Register
Views: 132|回复 Reply: 4
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] GROMACS计算四点水模型出现CPU和PCIE瓶颈,求优化方案

[复制链接 Copy URL]

7

帖子

0

威望

55

eV
积分
62

Level 2 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 AoyuJiao 于 2026-3-23 23:40 编辑

各位大佬好:

我最近在使用GROMACS2026.0在AMBER19SB+GAFF2+OPC下模拟蛋白质-小分子复合物,体系大小在10万原子左右。其性能相对于AMBER99SB-ILDN+GAFF+TIP3P,出现了严重的CPU和PCIE瓶颈,导致GPU一直在等CPU计算和数据传输。我已经尝试把nstlist放宽到1000,轨迹写入改到10ps一次(即5000),以及只分配6个核心和开启-pin on,但还是不尽人意。目前GPU利用率在95和100之间波动,显存占用1.5GB左右。求问大家有没有好的解决办法?谢谢大家!

我的硬件配置:
  1. CPU: R5 9600X
  2. GPU:2060 6G
  3. 主板:B650M
  4. 内存:DDR5 32GB 6000 C36
  5. 硬盘:1T SSD PCIE4
复制代码

系统环境:
  1. Ubuntu24.04.1 LTS (WSL2)
复制代码

限制性动力学的日志报告:    没放生产阶段的报告是因为生产阶段还在跑,我觉得二者的性能应该是类似的
  1.       R E A L   C Y C L E   A N D   T I M E   A C C O U N T I N G

  2. On 1 MPI rank, each using 6 OpenMP threads

  3. Activity:              Num   Num      Call    Wall time         Giga-Cycles
  4.                         Ranks Threads  Count      (s)         total sum    %
  5. --------------------------------------------------------------------------------
  6. Vsite constr.             1    6      50001       5.560        130.102   4.1
  7. Neighbor search           1    6        501       3.162         73.987   2.3
  8. Launch PP GPU ops.        1    6      99501       5.388        126.073   4.0
  9. Force                     1    6      50001       8.805        206.029   6.5
  10. PME GPU mesh              1    6      50001       6.356        148.733   4.7
  11. PME wait for PP                                 129.156       3022.174  95.3
  12. Wait GPU NB local         1    6      50001       6.052        141.611   4.5
  13. Wait GPU state copy       1    6      45000      85.106       1991.446  62.8
  14. NB X/F buffer ops.        1    6       5001       0.520         12.162   0.4
  15. Vsite spread              1    6      55002       2.976         69.632   2.2
  16. Write traj.               1    6          1       0.080          1.877   0.1
  17. Update                    1    6      50001       2.235         52.294   1.6
  18. Constraints               1    6      50003       6.557        153.429   4.8
  19. Kinetic energy            1    6      10001       0.622         14.552   0.5
  20. --------------------------------------------------------------------------------
  21. Total                                           135.512       3170.907 100.0
  22. --------------------------------------------------------------------------------
  23. Breakdown of PME mesh activities
  24. --------------------------------------------------------------------------------
  25. Wait PME GPU gather       1    6      50001       1.572         36.794   1.2
  26. Reduce GPU PME F          1    6      50001       0.226          5.287   0.2
  27. Launch PME GPU ops.       1    6     400008       3.872         90.596   2.9
  28. --------------------------------------------------------------------------------

  29.                Core t (s)   Wall t (s)        (%)
  30.        Time:      813.067      135.512      600.0
  31.                  (ns/day)    (hour/ns)    (ms/step)  (Matom*steps/s)
  32. Performance:       63.759        0.376        2.710           47.684
  33. Finished mdrun on rank 0 Mon Mar 23 23:00:54 2026
复制代码

357

帖子

0

威望

838

eV
积分
1195

Level 4 (黑子)

2#
发表于 Post on 2026-3-24 00:30:15 | 只看该作者 Only view this author
四点水的update只能在cpu进行,这是正常的吧。

988

帖子

4

威望

2326

eV
积分
3394

Level 5 (御坂)

A Student

3#
发表于 Post on 2026-3-24 02:44:23 | 只看该作者 Only view this author
补充一点,觉得OPC四点水贵可以换OPC3试试。
敬仰一针见血的指责,厌倦别有用心的赞美。

7

帖子

0

威望

55

eV
积分
62

Level 2 能力者

4#
 楼主 Author| 发表于 Post on 2026-3-24 08:50:55 | 只看该作者 Only view this author
KazusaT 发表于 2026-3-24 00:30
四点水的update只能在cpu进行,这是正常的吧。

好的谢谢,那我就放心了

7

帖子

0

威望

55

eV
积分
62

Level 2 能力者

5#
 楼主 Author| 发表于 Post on 2026-3-24 08:51:23 | 只看该作者 Only view this author
student0618 发表于 2026-3-24 02:44
补充一点,觉得OPC四点水贵可以换OPC3试试。

谢谢,有时间我试一下

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-4-13 14:29 , Processed in 0.168460 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list