计算化学公社

 找回密码 Forget password
 注册 Register
Views: 332|回复 Reply: 6
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] Windows-GROMACS进程卡死问题

[复制链接 Copy URL]

2

帖子

0

威望

27

eV
积分
29

Level 2 能力者

本帖最后由 vicc 于 2025-9-16 14:13 编辑

各位老师同行大家好,请教一下论坛中使用50系显卡跑GROMACS的朋友们有没有遇到过NVT/NPT/MD进程中卡死的情况,表现为脚本运行界面没有报错,但是steps和工作日志等都不更新(如图),CPU/GPU不占用。
相同的脚本在我之前的windows主机(I9-14900K+RTX4080,CUDA版本12.2)上从来没有发生,但是在目前的主机(U7-265K+RTX5080,CUDA试过了12.8和13.0版本)频繁遇到这种情况。目前已经初步排除了GROMACS版本的问题,测试了2025.3和一个2023的版本的GROMACS,在新主机上都会出现卡死问题,但旧主机都不会有这个问题。
在论坛中查看了相关的帖子发现也有使用CUDA12.8版本和50系显卡的,并没有遇到我这样的问题,不知道还能是什么原因

Quicker_20250916_111321.png (89.38 KB, 下载次数 Times of downloads: 1)

脚本运行界面

脚本运行界面

21

帖子

0

威望

174

eV
积分
195

Level 3 能力者

2#
发表于 Post on 2025-9-16 11:35:38 | 只看该作者 Only view this author
log文件比较重要,里面咋说的

2

帖子

0

威望

27

eV
积分
29

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2025-9-16 14:10:03 | 只看该作者 Only view this author
樊樊樊 发表于 2025-9-16 11:35
log文件比较重要,里面咋说的

我初步看了一下自以为没有什么问题,这里截取了md.log的最后几步,还请老师您帮忙看看:
           Step           Time
        4425000     8850.00000

   Energies (kJ/mol)
           Bond          Angle    Proper Dih. Ryckaert-Bell.          LJ-14
    1.12371e+04    3.14996e+04    1.77210e+03    1.50979e+04    2.00412e+04
     Coulomb-14        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.
    9.78565e+04    8.92762e+05   -3.62098e+04   -6.28024e+06    2.29810e+04
      Potential    Kinetic En.   Total Energy  Conserved En.    Temperature
   -5.22320e+06    9.59362e+05   -4.26384e+06   -4.19670e+06    3.00102e+02
Pres. DC (bar) Pressure (bar)   Constr. rmsd
   -1.58230e+02    4.77885e+01    2.67507e-06

           Step           Time
        4450000     8900.00000

   Energies (kJ/mol)
           Bond          Angle    Proper Dih. Ryckaert-Bell.          LJ-14
    1.12532e+04    3.12456e+04    1.76711e+03    1.52966e+04    2.00799e+04
     Coulomb-14        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.
    9.72429e+04    8.92259e+05   -3.62253e+04   -6.27581e+06    2.31236e+04
      Potential    Kinetic En.   Total Energy  Conserved En.    Temperature
   -5.21976e+06    9.61992e+05   -4.25777e+06   -4.19652e+06    3.00924e+02
Pres. DC (bar) Pressure (bar)   Constr. rmsd
   -1.58366e+02    9.42916e+01    2.65711e-06

           Step           Time
        4475000     8950.00000

   Energies (kJ/mol)
           Bond          Angle    Proper Dih. Ryckaert-Bell.          LJ-14
    1.12253e+04    3.13586e+04    1.84384e+03    1.51331e+04    1.99522e+04
     Coulomb-14        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.
    9.75176e+04    8.88168e+05   -3.61906e+04   -6.27227e+06    2.30011e+04
      Potential    Kinetic En.   Total Energy  Conserved En.    Temperature
   -5.22026e+06    9.59908e+05   -4.26035e+06   -4.19639e+06    3.00272e+02
Pres. DC (bar) Pressure (bar)   Constr. rmsd
   -1.58063e+02   -2.97464e+01    2.71178e-06

Writing checkpoint, step 4495400 at Tue Sep 16 14:00:40 2025


           Step           Time
        4500000     9000.00000

   Energies (kJ/mol)
           Bond          Angle    Proper Dih. Ryckaert-Bell.          LJ-14
    1.15389e+04    3.11239e+04    1.87792e+03    1.52831e+04    1.99894e+04
     Coulomb-14        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.
    9.76807e+04    8.89558e+05   -3.62356e+04   -6.27746e+06    2.34165e+04
      Potential    Kinetic En.   Total Energy  Conserved En.    Temperature
   -5.22323e+06    9.57594e+05   -4.26564e+06   -4.19615e+06    2.99549e+02
Pres. DC (bar) Pressure (bar)   Constr. rmsd
   -1.58455e+02    4.06880e+00    2.65472e-06

           Step           Time
        4525000     9050.00000

   Energies (kJ/mol)
           Bond          Angle    Proper Dih. Ryckaert-Bell.          LJ-14
    1.12722e+04    3.10697e+04    1.79316e+03    1.53128e+04    2.01499e+04
     Coulomb-14        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.
    9.78049e+04    8.93356e+05   -3.61676e+04   -6.28424e+06    2.28592e+04
      Potential    Kinetic En.   Total Energy  Conserved En.    Temperature
   -5.22679e+06    9.57782e+05   -4.26900e+06   -4.19599e+06    2.99608e+02
Pres. DC (bar) Pressure (bar)   Constr. rmsd
   -1.57862e+02    2.55574e+01    2.72078e-06

           Step           Time
        4550000     9100.00000

   Energies (kJ/mol)
           Bond          Angle    Proper Dih. Ryckaert-Bell.          LJ-14
    1.14517e+04    3.15287e+04    1.78872e+03    1.50767e+04    1.99821e+04
     Coulomb-14        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.
    9.79229e+04    8.88345e+05   -3.61465e+04   -6.26953e+06    2.32862e+04
      Potential    Kinetic En.   Total Energy  Conserved En.    Temperature
   -5.21630e+06    9.61274e+05   -4.25502e+06   -4.19587e+06    3.00700e+02
Pres. DC (bar) Pressure (bar)   Constr. rmsd
   -1.57679e+02    1.41943e+01    2.69349e-06

24

帖子

0

威望

364

eV
积分
388

Level 3 能力者

4#
发表于 Post on 2025-9-16 19:50:53 | 只看该作者 Only view this author
一般是体系的问题,换个简单的体系,比如只有蛋白的体系,是否也报错。跑一会儿直接退出,我遇到过,一般是小分子初始构象没有优化好导致。

21

帖子

0

威望

174

eV
积分
195

Level 3 能力者

5#
发表于 Post on 2025-9-17 09:35:22 | 只看该作者 Only view this author
vicc 发表于 2025-9-16 14:10
我初步看了一下自以为没有什么问题,这里截取了md.log的最后几步,还请老师您帮忙看看:
           Ste ...

看起来确实没什么问题,我也没办法找出原因。

2

帖子

0

威望

101

eV
积分
103

Level 2 能力者

6#
发表于 Post on 2025-10-19 09:11:40 | 只看该作者 Only view this author
我也遇到了一样的问题,显卡RTX 5060, gromacs是2025

262

帖子

0

威望

635

eV
积分
897

Level 4 (黑子)

7#
发表于 Post on 2025-10-19 22:57:13 | 只看该作者 Only view this author
这种情况极大概率是模拟崩溃了,仔细观看轨迹。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-25 05:00 , Processed in 0.254578 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list