计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4118|回复 Reply: 11
打印 Print 上一主题 Last thread 下一主题 Next thread

[其它] 服务器无缘无故自动重启,求助原因

[复制链接 Copy URL]

278

帖子

0

威望

4434

eV
积分
4712

Level 6 (一方通行)

服务器TB买的,2683V3*2,X10DRL-i,已经4年,过保修期,现在经常无缘无故重启,一般半小时内会自动重启一次,有的时候2-3分钟就重启了,win7和centos系统的时候都有,咨询了商家,说可能是cpu坏了或者风扇坏了,让我监测一下cpu温度,我看了看,没有超过最高临界温度,有的时候刚一开机,就重启了,感觉cpu和风扇应该没问题,想问问,有可能是什么原因呢?或者如何确定原因呢?

2407

帖子

1

威望

5948

eV
积分
8375

Level 6 (一方通行)

2#
发表于 Post on 2021-8-3 10:24:20 | 只看该作者 Only view this author
商家说的对.

如主板支持BMC/IPMI, 可以先看看日志信息.
参考这个 使用IPMI
https://www.bilibili.com/video/BV1Sv41147Du/

可能界面有所不同, 但是用法都差不多.
去看看日志信息.

再去系统看看日志信息.

或者, 报废机器, 买新的.

买同样的一台, 可能7000元不到; 维修费用, 或者自己捣鼓修机器, 耗费的时间, 可不是一两个小时能搞定的.

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

22

帖子

0

威望

168

eV
积分
190

Level 3 能力者

3#
发表于 Post on 2021-8-3 16:14:04 | 只看该作者 Only view this author
内存有问题了吧,直接重启,都没有蓝屏什么的提示吗?

136

帖子

0

威望

2432

eV
积分
2568

Level 5 (御坂)

4#
发表于 Post on 2021-8-3 16:16:21 | 只看该作者 Only view this author
先把内存全拔掉就剩一根试试
还不行就拔cpu,每次就用一个cpu启动试试
拔cpu时候千万小心别把主板针脚搞歪了

278

帖子

0

威望

4434

eV
积分
4712

Level 6 (一方通行)

5#
 楼主 Author| 发表于 Post on 2021-8-3 17:20:56 | 只看该作者 Only view this author
zhangshuo420 发表于 2021-8-3 16:14
内存有问题了吧,直接重启,都没有蓝屏什么的提示吗?

完全没有任何提示,就是直接重启。

197

帖子

0

威望

4408

eV
积分
4605

Level 6 (一方通行)

6#
发表于 Post on 2021-8-3 17:28:56 | 只看该作者 Only view this author
看下Windows 事件查看器-Windows日志-系统 里面是什么提示,把能卸了的设备都拆出来,比如说不必要的内存、硬盘、显卡、USB设备等;看下插座和机箱内有没有接触不好;直接进BIOS看下会不会重启,排除下系统是否存在问题

464

帖子

9

威望

6494

eV
积分
7138

Level 6 (一方通行)

BSJ Institute

7#
发表于 Post on 2021-8-3 17:36:00 | 只看该作者 Only view this author
不要忽视电源的问题。CPU几乎不会坏,服务器内存老化出问题概率也不大,倒是在我的经验中仅经我手的机器中就有两台电源年久用坏导致无法正常开机的。

评分 Rate

参与人数
Participants 2
eV +2 收起 理由
Reason
Geyer + 1 正解
Butadiene + 1 正解

查看全部评分 View all ratings

1187

帖子

5

威望

2859

eV
积分
4146

Level 6 (一方通行)

8#
发表于 Post on 2021-8-3 18:27:56 | 只看该作者 Only view this author
ls+1。电源电压不稳很容易出现这类问题

278

帖子

0

威望

4434

eV
积分
4712

Level 6 (一方通行)

9#
 楼主 Author| 发表于 Post on 2021-8-4 13:49:13 | 只看该作者 Only view this author
tiandikuoyuan 发表于 2021-8-3 17:28
看下Windows 事件查看器-Windows日志-系统 里面是什么提示,把能卸了的设备都拆出来,比如说不必要的内存、 ...

现在是linux系统,有无可查的日志呢?

54

帖子

0

威望

1303

eV
积分
1357

Level 4 (黑子)

10#
发表于 Post on 2021-8-4 23:51:52 | 只看该作者 Only view this author
可以找个硬盘,装windows,看看是否还重启,排查软件还是硬件的问题。
对我而言,window排查故障,更容易些。

79

帖子

2

威望

719

eV
积分
838

Level 4 (黑子)

11#
发表于 Post on 2021-8-5 00:17:29 | 只看该作者 Only view this author
有两个可能原因,其一是上面说到过的电源
另外一种可能是vrm处的散热片
检查一下硅胶片有没有老化失效或vrm散热片有没有脱落,这个很关键

129

帖子

0

威望

709

eV
积分
838

Level 4 (黑子)

12#
发表于 Post on 2021-8-17 14:40:06 | 只看该作者 Only view this author
有问题,看主板的后台,也就是IPMI,看IPMI里的健康日志。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 19:05 , Processed in 0.394345 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list