计算化学公社

标题: GROMACS计算四点水模型出现CPU和PCIE瓶颈,求优化方案 [打印本页]

作者
Author:
AoyuJiao    时间: 2026-3-23 23:40
标题: GROMACS计算四点水模型出现CPU和PCIE瓶颈,求优化方案
本帖最后由 AoyuJiao 于 2026-3-23 23:40 编辑

各位大佬好:

我最近在使用GROMACS2026.0在AMBER19SB+GAFF2+OPC下模拟蛋白质-小分子复合物,体系大小在10万原子左右。其性能相对于AMBER99SB-ILDN+GAFF+TIP3P,出现了严重的CPU和PCIE瓶颈,导致GPU一直在等CPU计算和数据传输。我已经尝试把nstlist放宽到1000,轨迹写入改到10ps一次(即5000),以及只分配6个核心和开启-pin on,但还是不尽人意。目前GPU利用率在95和100之间波动,显存占用1.5GB左右。求问大家有没有好的解决办法?谢谢大家!

我的硬件配置:
  1. CPU: R5 9600X
  2. GPU:2060 6G
  3. 主板:B650M
  4. 内存:DDR5 32GB 6000 C36
  5. 硬盘:1T SSD PCIE4
复制代码

系统环境:
  1. Ubuntu24.04.1 LTS (WSL2)
复制代码

限制性动力学的日志报告:    没放生产阶段的报告是因为生产阶段还在跑,我觉得二者的性能应该是类似的
  1.       R E A L   C Y C L E   A N D   T I M E   A C C O U N T I N G

  2. On 1 MPI rank, each using 6 OpenMP threads

  3. Activity:              Num   Num      Call    Wall time         Giga-Cycles
  4.                         Ranks Threads  Count      (s)         total sum    %
  5. --------------------------------------------------------------------------------
  6. Vsite constr.             1    6      50001       5.560        130.102   4.1
  7. Neighbor search           1    6        501       3.162         73.987   2.3
  8. Launch PP GPU ops.        1    6      99501       5.388        126.073   4.0
  9. Force                     1    6      50001       8.805        206.029   6.5
  10. PME GPU mesh              1    6      50001       6.356        148.733   4.7
  11. PME wait for PP                                 129.156       3022.174  95.3
  12. Wait GPU NB local         1    6      50001       6.052        141.611   4.5
  13. Wait GPU state copy       1    6      45000      85.106       1991.446  62.8
  14. NB X/F buffer ops.        1    6       5001       0.520         12.162   0.4
  15. Vsite spread              1    6      55002       2.976         69.632   2.2
  16. Write traj.               1    6          1       0.080          1.877   0.1
  17. Update                    1    6      50001       2.235         52.294   1.6
  18. Constraints               1    6      50003       6.557        153.429   4.8
  19. Kinetic energy            1    6      10001       0.622         14.552   0.5
  20. --------------------------------------------------------------------------------
  21. Total                                           135.512       3170.907 100.0
  22. --------------------------------------------------------------------------------
  23. Breakdown of PME mesh activities
  24. --------------------------------------------------------------------------------
  25. Wait PME GPU gather       1    6      50001       1.572         36.794   1.2
  26. Reduce GPU PME F          1    6      50001       0.226          5.287   0.2
  27. Launch PME GPU ops.       1    6     400008       3.872         90.596   2.9
  28. --------------------------------------------------------------------------------

  29.                Core t (s)   Wall t (s)        (%)
  30.        Time:      813.067      135.512      600.0
  31.                  (ns/day)    (hour/ns)    (ms/step)  (Matom*steps/s)
  32. Performance:       63.759        0.376        2.710           47.684
  33. Finished mdrun on rank 0 Mon Mar 23 23:00:54 2026
复制代码


作者
Author:
KazusaT    时间: 2026-3-24 00:30
四点水的update只能在cpu进行,这是正常的吧。
作者
Author:
student0618    时间: 2026-3-24 02:44
补充一点,觉得OPC四点水贵可以换OPC3试试。
作者
Author:
AoyuJiao    时间: 2026-3-24 08:50
KazusaT 发表于 2026-3-24 00:30
四点水的update只能在cpu进行,这是正常的吧。

好的谢谢,那我就放心了
作者
Author:
AoyuJiao    时间: 2026-3-24 08:51
student0618 发表于 2026-3-24 02:44
补充一点,觉得OPC四点水贵可以换OPC3试试。

谢谢,有时间我试一下




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3