计算化学公社

标题: 节点node出现“down”是什么原因? [打印本页]

作者
Author:
wy标点人生    时间: 2021-7-21 10:45
标题: 节点node出现“down”是什么原因?
曾经有一个节点出现了“down”的情况,后面通过重启节点解决了,后面又出现这种情况,只不过节点不一样,这是什么原因呢?只能通过重启解决吗?希望各位老师能够帮助我解答一下!
作者
Author:
Accelerator    时间: 2021-7-21 10:55
我也遇到过此类情况,怀疑可能是NFS掉线所致
作者
Author:
abin    时间: 2021-7-21 11:05
和集群具体配置有关系.

我可以协助调试. 如有需要, 请电邮联系我.
作者
Author:
jdl    时间: 2023-12-24 18:14
abin 发表于 2021-7-21 11:05
和集群具体配置有关系.

我可以协助调试. 如有需要, 请电邮联系我.

你好,我想请问一下计算机集群down怎么重启,而且down的频率有点高
作者
Author:
abin    时间: 2023-12-24 20:03
jdl 发表于 2023-12-24 18:14
你好,我想请问一下计算机集群down怎么重启,而且down的频率有点高

集群down
对应的中文表述是 集群宕机,
就是无法登的登录无法使用。

造成宕机的原因有很多……

如果你问某一个节点出现down标识,
最简单的就是重启对应的计算节点。

具体能否恢复,与集群搭建采用的方案有关。

重启服务器,最简单的就是,
IPMI管理中,点击power reset.

或者去现场,按住电源,一直按住,直到所有灯熄灭。
松开手指,等至少三十秒,
再按一下电源,就开机了。
这相当于,一次冷启动。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3