计算化学公社

标题: 服务器无缘无故自动重启,求助原因 [打印本页]

作者
Author:
dreamyeye    时间: 2021-8-3 09:28
标题: 服务器无缘无故自动重启,求助原因
服务器TB买的,2683V3*2,X10DRL-i,已经4年,过保修期,现在经常无缘无故重启,一般半小时内会自动重启一次,有的时候2-3分钟就重启了,win7和centos系统的时候都有,咨询了商家,说可能是cpu坏了或者风扇坏了,让我监测一下cpu温度,我看了看,没有超过最高临界温度,有的时候刚一开机,就重启了,感觉cpu和风扇应该没问题,想问问,有可能是什么原因呢?或者如何确定原因呢?

作者
Author:
abin    时间: 2021-8-3 10:24
商家说的对.

如主板支持BMC/IPMI, 可以先看看日志信息.
参考这个 使用IPMI
https://www.bilibili.com/video/BV1Sv41147Du/

可能界面有所不同, 但是用法都差不多.
去看看日志信息.

再去系统看看日志信息.

或者, 报废机器, 买新的.

买同样的一台, 可能7000元不到; 维修费用, 或者自己捣鼓修机器, 耗费的时间, 可不是一两个小时能搞定的.


作者
Author:
zhangshuo420    时间: 2021-8-3 16:14
内存有问题了吧,直接重启,都没有蓝屏什么的提示吗?
作者
Author:
doublezhang    时间: 2021-8-3 16:16
先把内存全拔掉就剩一根试试
还不行就拔cpu,每次就用一个cpu启动试试
拔cpu时候千万小心别把主板针脚搞歪了
作者
Author:
dreamyeye    时间: 2021-8-3 17:20
zhangshuo420 发表于 2021-8-3 16:14
内存有问题了吧,直接重启,都没有蓝屏什么的提示吗?

完全没有任何提示,就是直接重启。
作者
Author:
tiandikuoyuan    时间: 2021-8-3 17:28
看下Windows 事件查看器-Windows日志-系统 里面是什么提示,把能卸了的设备都拆出来,比如说不必要的内存、硬盘、显卡、USB设备等;看下插座和机箱内有没有接触不好;直接进BIOS看下会不会重启,排除下系统是否存在问题
作者
Author:
Accelerator    时间: 2021-8-3 17:36
不要忽视电源的问题。CPU几乎不会坏,服务器内存老化出问题概率也不大,倒是在我的经验中仅经我手的机器中就有两台电源年久用坏导致无法正常开机的。
作者
Author:
snljty    时间: 2021-8-3 18:27
ls+1。电源电压不稳很容易出现这类问题
作者
Author:
dreamyeye    时间: 2021-8-4 13:49
tiandikuoyuan 发表于 2021-8-3 17:28
看下Windows 事件查看器-Windows日志-系统 里面是什么提示,把能卸了的设备都拆出来,比如说不必要的内存、 ...

现在是linux系统,有无可查的日志呢?
作者
Author:
CrysLantZ    时间: 2021-8-4 23:51
可以找个硬盘,装windows,看看是否还重启,排查软件还是硬件的问题。
对我而言,window排查故障,更容易些。
作者
Author:
Geyer    时间: 2021-8-5 00:17
有两个可能原因,其一是上面说到过的电源
另外一种可能是vrm处的散热片
检查一下硅胶片有没有老化失效或vrm散热片有没有脱落,这个很关键
作者
Author:
janstao    时间: 2021-8-17 14:40
有问题,看主板的后台,也就是IPMI,看IPMI里的健康日志。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3