计算化学公社

标题: 求助:高斯09经常无缘无故中断 [打印本页]

作者
Author:
霜晨月    时间: 2019-1-15 20:22
标题: 求助:高斯09经常无缘无故中断
在linux服务器上跑高斯09.E01,经常跑到中间就无缘无故地中断了,每次的信息都是下面这样:

(这之前都是正常输出信息)
Error: hangup
Error: hangup
   rax 0000000000000040, rbx 00002b8edfef6568, rcx 00002b8edfef66b0
   rdx 00002b8edfee4898, rsp 00007ffecc496ce0, rbp 00007ffecc497400
   rsi 00002b8edee0ae68, rdi 00002b8edf524520, r8  000000000001f50b
   rax fffffffffffffffc, rbx 00007ffd8e0e4df0, rcx ffffffffffffffff
   r9  00000000000136e8, r10 beba697013a75390, r11 00002b8edfee43c0
   rdx 0000000000000000, rsp 00007ffd8e0e4db8, rbp 0000000000000001
   r12 00002b8edfef6568, r13 00000000000001b4, r14 000000000000006e
   rsi 00007ffd8e0e4df0, rdi 0000000000006f2f, r8  00002afe7d6db700
   r15 00002b8edee0ae68
   r9  0000000000000000, r10 0000000000000000, r11 0000000000000246
   r12 00007ffd8e0e4e10, r13 000000000000006a, r14 0000000000000000
   r15 00007ffd8e0eb7d0
  /lib64/libpthread.so.0(+0xf5e0) [0x2b8ede32c5e0]
  /home/soft/g09/g09/l502.exe() [0xaec72b]
  /home/soft/g09/g09/l502.exe() [0x845eb1]
  /home/soft/g09/g09/l502.exe() [0x83737c]
  /home/soft/g09/g09/l502.exe() [0x69d657]
  /home/soft/g09/g09/l502.exe() [0x4c4666]
  /home/soft/g09/g09/l502.exe() [0x4ca808]
  /home/soft/g09/g09/l502.exe() [0x4b3406]
  /home/soft/g09/g09/l502.exe() [0x519ab0]
  /home/soft/g09/g09/l502.exe() [0x41a7eb]
  /home/soft/g09/g09/l502.exe() [0x40ecce]
  /home/soft/g09/g09/l502.exe() [0x4037b0]
  /home/soft/g09/g09/l502.exe() [0x4036ed]
  /lib64/libc.so.6(__libc_start_main+0xf5) [0x2b8ede85cc05]
  /home/soft/g09/g09/l502.exe() [0x4035e9]
  /lib64/libpthread.so.0(+0xf5e0) [0x2afe7ce0e5e0]
  /lib64/libc.so.6(waitpid+0x1c) [0x2afe7d3dbdbc]
  /lib64/libc.so.6(+0x41cc2) [0x2afe7d35ecc2]
  g09() [0x408189]
  g09() [0x404951]
  g09() [0x40358d]
  /lib64/libc.so.6(__libc_start_main+0xf5) [0x2afe7d33ec05]
  g09() [0x403489]


这个应该不是计算过程中的错误,因为同一个任务反复尝试,有时跑到step 15中断,有时跑到step 28中断,当然运气好的话也可能顺利完成。(拿到别的机器上去算,就没任何问题。)
而且,如果服务器上同时跑着2~3个高斯任务,这几个任务总是同时中断。
服务器跑别的任务比如gmx、amber,连续跑几天都没问题。

有没有老师遇到过类似的问题?多谢



作者
Author:
算一算    时间: 2019-1-16 01:20
可能是那台机器空间太小
作者
Author:
霜晨月    时间: 2019-1-16 11:19
算一算 发表于 2019-1-16 01:20
可能是那台机器空间太小

硬盘空间还是内存空间?硬盘空间是足够的。
内存64G,每个任务分配30G,一般很少超过两个任务

作者
Author:
算一算    时间: 2019-1-16 18:42
霜晨月 发表于 2019-1-16 11:19
硬盘空间还是内存空间?硬盘空间是足够的。
内存64G,每个任务分配30G,一般很少超过两个任务

别人也在用那台机器吧,所以也占内存
作者
Author:
sobereva    时间: 2019-1-16 23:32
内存别顶着头分配,多留点余量
作者
Author:
xaomidaxue    时间: 2019-1-17 12:46
硬盘或者内存问题
作者
Author:
zhangzhiyuanscu    时间: 2023-6-29 09:44
sobereva 发表于 2019-1-16 23:32
内存别顶着头分配,多留点余量

我也遇到了这种情况。请问是%Men=???在运行的时候是应该改小一点对吗?
作者
Author:
sobereva    时间: 2023-6-29 23:42
zhangzhiyuanscu 发表于 2023-6-29 09:44
我也遇到了这种情况。请问是%Men=???在运行的时候是应该改小一点对吗?

没有叫%Men的设置

该说的都说了
Gaussian的安装方法及运行时的相关问题
http://sobereva.com/439http://bbs.keinsci.com/thread-10814-1-1.html
作者
Author:
gsbear    时间: 2024-3-19 22:02
最近我也遇到这个问题,先一直怀疑是gaussian版本的问题,也曾经怀疑过内存分配的问题,最后发现都不是。
出现这个Error: hangup的问题是ssh没有正常通过exit退出(可能直接关窗口或者网络连接非正常断开导致的)
解决这个问题很简单,后台提交任务后通过exit退出登陆,以免网络连接出错导致hangup就可以。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3