计算化学公社

标题: GPU加速的GROMCS运行中重启?碰到过没有。 [打印本页]

作者
Author:
lao7    时间: 2020-11-6 19:20
标题: GPU加速的GROMCS运行中重启?碰到过没有。
本帖最后由 lao7 于 2020-11-6 19:28 编辑

诸位老师,我最近使用GROMACS2018.4和GPU 2070S跑分子动力学,但跑一段时间后,突然机器重启,系统也安装了几遍了。电源功率足够,不运行分子动力学,仅仅开机时不会重启。查询说可能由于centos 7.6的内核版本不稳定造成的,不知诸位是否遇到跑GPU加速的分子动力学时CentOS7.6内核不稳定的问题?谢谢。

作者
Author:
abin    时间: 2020-11-7 08:24
本帖最后由 abin 于 2020-11-7 08:50 编辑

不会是热死了吧?

啥处理器呀?
这几天看到一位小新机器,
8175M处理器,还没有配备GPU卡呢,
频繁重启。
看了一下,处理器满载的时候,温度持续90度以上。
也就是热死了。



作者
Author:
lao7    时间: 2020-11-7 09:29
abin 发表于 2020-11-7 08:24
不会是热死了吧?

啥处理器呀?

CPU不会有过热降频保护吗?热死咋办?现在我把系统版本从7.6升级到7.8试试。如果还出现问题,估计有可能热死的!但现在快冬天了。
作者
Author:
abin    时间: 2020-11-7 09:38
lao7 发表于 2020-11-7 09:29
CPU不会有过热降频保护吗?热死咋办?现在我把系统版本从7.6升级到7.8试试。如果还出现问题,估计有可能 ...

系统日志会有记录。

主板BMC也会有记录。
现在多数服务器主板都有BMC芯片。
如果对此不了解,建议查询自己主板手册,看看有没有支援该功能。
作者
Author:
sobereva    时间: 2020-11-7 17:09
电源标称的功率足够不代表目前电源状态正常。你当前的现象有极大概率是电源故障导致的,换个电源再试。也监控当前温度,排除温度过高导致问题的可能性
作者
Author:
lao7    时间: 2020-11-7 23:51
谢谢各位老师!我准备更换超微机箱和电源。如果有定论,我会及时反馈给大家。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3