计算化学公社

 找回密码 Forget password
 注册 Register
Views: 347|回复 Reply: 18
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] GROMACS运行十几分钟便任务中断无报错信息

[复制链接 Copy URL]

14

帖子

0

威望

147

eV
积分
161

Level 3 能力者

在服务器跑gromacs任务时,每次运行十几分钟便远程连接自动断开,重新连接后任务中断(手动exit退出也会后一段时间后任务也会中断),产生的log文件无报错信息。于是更换了服务器硬盘并重装系统,并尝试了不同版本的gromacs问题仍然无法解决,请问有可能是什么原因造成的?

3d6f73b4-7b85-4658-8a56-1f16461e1788.png (10.61 KB, 下载次数 Times of downloads: 1)

3d6f73b4-7b85-4658-8a56-1f16461e1788.png

14

帖子

0

威望

147

eV
积分
161

Level 3 能力者

19#
 楼主 Author| 发表于 Post on 2026-2-5 17:08:17 | 只看该作者 Only view this author
iehtian 发表于 2026-2-5 16:50
screen中跑也是相同现象吗?即使不退出shell,ssh在长时间未操作或服务器高压的情况下也是有可能断掉的

我回头screen跑一下试试

6

帖子

0

威望

50

eV
积分
56

Level 2 能力者

18#
发表于 Post on 2026-2-5 16:50:57 | 只看该作者 Only view this author
screen中跑也是相同现象吗?即使不退出shell,ssh在长时间未操作或服务器高压的情况下也是有可能断掉的

14

帖子

0

威望

147

eV
积分
161

Level 3 能力者

17#
 楼主 Author| 发表于 Post on 2026-2-5 16:43:40 | 只看该作者 Only view this author
监测了一下系统日志,可能是CPU的问题,我看看想办法处理一下硬件,谢谢各位老师解答

736ad46b-f122-40fc-a500-000516094c4c.png (49.67 KB, 下载次数 Times of downloads: 2)

736ad46b-f122-40fc-a500-000516094c4c.png

15

帖子

0

威望

895

eV
积分
910

Level 4 (黑子)

16#
发表于 Post on 2026-2-5 16:24:10 | 只看该作者 Only view this author
1.如果怀疑是终端退出的问题:
改用screen,运行命令后,Ctrl+A+D
2.如果怀疑真的是结构体系的问题
可以将gmx的计算全部放在CPU上算(不放在GPU),这样log的报错信息更完整。

306

帖子

0

威望

688

eV
积分
994

Level 4 (黑子)

15#
发表于 Post on 2026-2-5 15:26:36 | 只看该作者 Only view this author
chemTT 发表于 2026-2-5 15:05
您好老师,我现在用这条命令,不退出shell还是会挂,和我之前的情况一样,感觉可能还是服务器本身的问题

那么这次报错的情况是什么?
能够运行一段时间的话查看过结构吗?

14

帖子

0

威望

147

eV
积分
161

Level 3 能力者

14#
 楼主 Author| 发表于 Post on 2026-2-5 15:05:07 | 只看该作者 Only view this author
yuzc 发表于 2026-2-5 10:34
没加nohup,退出shell当然任务会挂。
用nohup gmx mdrun -nt 48 -pin on  -pinoffset 0 -deffnm npt -s  ...

您好老师,我现在用这条命令,不退出shell还是会挂,和我之前的情况一样,感觉可能还是服务器本身的问题

306

帖子

0

威望

688

eV
积分
994

Level 4 (黑子)

13#
发表于 Post on 2026-2-5 10:38:39 | 只看该作者 Only view this author
chemTT 发表于 2026-2-5 08:25
gmx mdrun -nt 48 -pin on  -pinoffset 0 -deffnm npt -s npt.tpr

显然会挂啊。你得学习一下linux系统和ssh的基本操作

94

帖子

0

威望

467

eV
积分
561

Level 4 (黑子)

12#
发表于 Post on 2026-2-5 10:34:30 | 只看该作者 Only view this author
chemTT 发表于 2026-2-5 08:25
gmx mdrun -nt 48 -pin on  -pinoffset 0 -deffnm npt -s npt.tpr

没加nohup,退出shell当然任务会挂。
用nohup gmx mdrun -nt 48 -pin on  -pinoffset 0 -deffnm npt -s npt.tpr > a.log & 即可。

882

帖子

4

威望

2026

eV
积分
2988

Level 5 (御坂)

A Student

11#
发表于 Post on 2026-2-5 08:48:14 | 只看该作者 Only view this author
chemTT 发表于 2026-2-5 08:25
gmx mdrun -nt 48 -pin on  -pinoffset 0 -deffnm npt -s npt.tpr

没nohup 停掉很正常哦。
敬仰一针见血的指责,厌倦别有用心的赞美。

14

帖子

0

威望

147

eV
积分
161

Level 3 能力者

10#
 楼主 Author| 发表于 Post on 2026-2-5 08:25:05 | 只看该作者 Only view this author
KazusaT 发表于 2026-2-4 23:03
那你能不能把你用的命令贴一下

gmx mdrun -nt 48 -pin on  -pinoffset 0 -deffnm npt -s npt.tpr </dev/null &

306

帖子

0

威望

688

eV
积分
994

Level 4 (黑子)

9#
发表于 Post on 2026-2-4 23:03:09 | 只看该作者 Only view this author
chemTT 发表于 2026-2-4 22:28
我的理解是exit断开远程之后,程序的运行就不受远程影响了。之前断开远程确实不会影响程序运行,而且现在 ...

那你能不能把你用的命令贴一下

14

帖子

0

威望

147

eV
积分
161

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2026-2-4 22:28:26 | 只看该作者 Only view this author
UW_0728. 发表于 2026-2-4 21:36
你在前端跑的,只要退出登录那你当前用户在前端运行的所有任务都会自动被系统杀掉。
你们的服务器难道没有 ...

我的理解是exit断开远程之后,程序的运行就不受远程影响了。之前断开远程确实不会影响程序运行,而且现在不断开远程,gromacs程序也会运行十几分钟就停止

115

帖子

0

威望

471

eV
积分
586

Level 4 (黑子)

7#
发表于 Post on 2026-2-4 21:36:37 | 只看该作者 Only view this author
你在前端跑的,只要退出登录那你当前用户在前端运行的所有任务都会自动被系统杀掉。
你们的服务器难道没有slurm之类的作业调度系统吗?

306

帖子

0

威望

688

eV
积分
994

Level 4 (黑子)

6#
发表于 Post on 2026-2-4 21:20:47 | 只看该作者 Only view this author
chemTT 发表于 2026-2-4 20:34
在xshell里输完跑的命令,然后exit退出xshell

...那肯定会停啊,你的终端退出了啊

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-16 21:48 , Processed in 0.194689 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list