计算化学公社

标题: linux计算狂死机windows正常 [打印本页]

作者
Author:
mol    时间: 2017-1-18 09:29
标题: linux计算狂死机windows正常
各位老师,组里最近配了台服务器,E5 2686 v4的cpu,装上各种版本的linux(rhel 7.1,centos 7,fedora 25)在计算的时候都会出现死机,但是装上windows测试就没问题,很诡异,同一批的其他两台同样配置的服务器装的rhel7.1均没有问题,请教各位老师有可能是哪方面的问题?

作者
Author:
ggdh    时间: 2017-1-18 11:46
首先确定你的cpu是不是es版的。
你做的什么计算,具体的死机过程是怎样的?

作者
Author:
PhoenixYeti    时间: 2017-1-18 18:56
ARK上查不到这颗CPU怎么回事?
作者
Author:
mol    时间: 2017-1-19 11:23
ggdh 发表于 2017-1-18 11:46
首先确定你的cpu是不是es版的。
你做的什么计算,具体的死机过程是怎样的?

不是es版,算gmx,windows下用AIDA64做的稳定性测试。
在win下测试了5天没问题,在linux下跑gmx10分钟左右死机,有时候能跑3个小时,电脑没反应,电源灯亮着。
昨天用了一半的核算gmx,目前为止还没出问题,初步猜测可能是电源的问题?
作者
Author:
paramecium86    时间: 2017-1-20 10:23
PhoenixYeti 发表于 2017-1-18 18:56
ARK上查不到这颗CPU怎么回事?

这个不是官方发布的版本 本质上是2697v4的马甲turbo频率低个0.1什么的。上一代 2686v3 是 2699v3的马甲  2686这个代号的u一般比较发热厉害功率也大。我同时配过两台 一台2686v3 一台2698v4  2686用水冷 2698用风冷 俩cpu温度相当。这算的时候挂掉总感觉是过热了呢。。
作者
Author:
sobereva    时间: 2017-1-21 11:08
mol 发表于 2017-1-19 11:23
不是es版,算gmx,windows下用AIDA64做的稳定性测试。
在win下测试了5天没问题,在linux下跑gmx10分钟左 ...


联系供应商
或者自己把运行正常的服务器的电源替换到有问题的上面看看是否是这个原因。替换法是找死机这种情况原因的常用做法。
作者
Author:
mol    时间: 2017-7-4 15:52
paramecium86 发表于 2017-1-20 10:23
这个不是官方发布的版本 本质上是2697v4的马甲turbo频率低个0.1什么的。上一代 2686v3 是 2699v3的马甲   ...

应该不是过热,用lm-sensors检测挂掉的时候也就60多度
作者
Author:
mol    时间: 2017-7-4 15:53
sobereva 发表于 2017-1-21 11:08
联系供应商
或者自己把运行正常的服务器的电源替换到有问题的上面看看是否是这个原因。替换法是找死机 ...

供应商也没搞定,帮忙把电源、内存,硬盘都互换了,还是死机,这三个基本排除了

这样开来就是主板和cpu的问题比较大了
作者
Author:
ulosggs    时间: 2017-7-5 00:13
什么牌子的服务器,有更新过BIOS吗?
作者
Author:
sobereva    时间: 2017-7-5 06:23
mol 发表于 2017-7-4 15:53
供应商也没搞定,帮忙把电源、内存,硬盘都互换了,还是死机,这三个基本排除了

这样开来就是主板和cp ...


CPU极少会用出问题,99.9%可能性就是主板
作者
Author:
mol    时间: 2017-7-5 12:39
本帖最后由 mol 于 2017-7-5 13:01 编辑
ulosggs 发表于 2017-7-5 00:13
什么牌子的服务器,有更新过BIOS吗?

组装的,主板是超微的,木有更新过哎,
您的意思是更新下bios试试?

作者
Author:
ulosggs    时间: 2017-7-5 12:44
mol 发表于 2017-7-5 12:39
组装的,主板是微星的,木有更新过哎,
您的意思是更新下bios试试?

实验室DELL的机器,出现诡异的问题(像是CPU性能突然下降)都是通过更新BIOS解决的。
你可以试一下。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3