计算化学公社

 找回密码 Forget password
 注册 Register
Views: 7131|回复 Reply: 11
打印 Print 上一主题 Last thread 下一主题 Next thread

[Linux] linux计算狂死机windows正常

[复制链接 Copy URL]

306

帖子

0

威望

4869

eV
积分
5175

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
各位老师,组里最近配了台服务器,E5 2686 v4的cpu,装上各种版本的linux(rhel 7.1,centos 7,fedora 25)在计算的时候都会出现死机,但是装上windows测试就没问题,很诡异,同一批的其他两台同样配置的服务器装的rhel7.1均没有问题,请教各位老师有可能是哪方面的问题?

903

帖子

37

威望

5324

eV
积分
6967

Level 6 (一方通行)

2#
发表于 Post on 2017-1-18 11:46:09 | 只看该作者 Only view this author
首先确定你的cpu是不是es版的。
你做的什么计算,具体的死机过程是怎样的?

53

帖子

0

威望

1302

eV
积分
1355

Level 4 (黑子)

3#
发表于 Post on 2017-1-18 18:56:28 | 只看该作者 Only view this author
ARK上查不到这颗CPU怎么回事?

306

帖子

0

威望

4869

eV
积分
5175

Level 6 (一方通行)

4#
 楼主 Author| 发表于 Post on 2017-1-19 11:23:25 | 只看该作者 Only view this author
ggdh 发表于 2017-1-18 11:46
首先确定你的cpu是不是es版的。
你做的什么计算,具体的死机过程是怎样的?

不是es版,算gmx,windows下用AIDA64做的稳定性测试。
在win下测试了5天没问题,在linux下跑gmx10分钟左右死机,有时候能跑3个小时,电脑没反应,电源灯亮着。
昨天用了一半的核算gmx,目前为止还没出问题,初步猜测可能是电源的问题?

320

帖子

1

威望

5357

eV
积分
5697

Level 6 (一方通行)

5#
发表于 Post on 2017-1-20 10:23:39 | 只看该作者 Only view this author
PhoenixYeti 发表于 2017-1-18 18:56
ARK上查不到这颗CPU怎么回事?

这个不是官方发布的版本 本质上是2697v4的马甲turbo频率低个0.1什么的。上一代 2686v3 是 2699v3的马甲  2686这个代号的u一般比较发热厉害功率也大。我同时配过两台 一台2686v3 一台2698v4  2686用水冷 2698用风冷 俩cpu温度相当。这算的时候挂掉总感觉是过热了呢。。

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

6#
发表于 Post on 2017-1-21 11:08:56 | 只看该作者 Only view this author
mol 发表于 2017-1-19 11:23
不是es版,算gmx,windows下用AIDA64做的稳定性测试。
在win下测试了5天没问题,在linux下跑gmx10分钟左 ...


联系供应商
或者自己把运行正常的服务器的电源替换到有问题的上面看看是否是这个原因。替换法是找死机这种情况原因的常用做法。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

306

帖子

0

威望

4869

eV
积分
5175

Level 6 (一方通行)

7#
 楼主 Author| 发表于 Post on 2017-7-4 15:52:23 | 只看该作者 Only view this author
paramecium86 发表于 2017-1-20 10:23
这个不是官方发布的版本 本质上是2697v4的马甲turbo频率低个0.1什么的。上一代 2686v3 是 2699v3的马甲   ...

应该不是过热,用lm-sensors检测挂掉的时候也就60多度

306

帖子

0

威望

4869

eV
积分
5175

Level 6 (一方通行)

8#
 楼主 Author| 发表于 Post on 2017-7-4 15:53:00 | 只看该作者 Only view this author
sobereva 发表于 2017-1-21 11:08
联系供应商
或者自己把运行正常的服务器的电源替换到有问题的上面看看是否是这个原因。替换法是找死机 ...

供应商也没搞定,帮忙把电源、内存,硬盘都互换了,还是死机,这三个基本排除了

这样开来就是主板和cpu的问题比较大了

50

帖子

0

威望

1491

eV
积分
1542

Level 5 (御坂)

9#
发表于 Post on 2017-7-5 00:13:48 | 只看该作者 Only view this author
什么牌子的服务器,有更新过BIOS吗?

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

10#
发表于 Post on 2017-7-5 06:23:20 | 只看该作者 Only view this author
mol 发表于 2017-7-4 15:53
供应商也没搞定,帮忙把电源、内存,硬盘都互换了,还是死机,这三个基本排除了

这样开来就是主板和cp ...


CPU极少会用出问题,99.9%可能性就是主板
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

306

帖子

0

威望

4869

eV
积分
5175

Level 6 (一方通行)

11#
 楼主 Author| 发表于 Post on 2017-7-5 12:39:08 | 只看该作者 Only view this author
本帖最后由 mol 于 2017-7-5 13:01 编辑
ulosggs 发表于 2017-7-5 00:13
什么牌子的服务器,有更新过BIOS吗?

组装的,主板是超微的,木有更新过哎,
您的意思是更新下bios试试?

50

帖子

0

威望

1491

eV
积分
1542

Level 5 (御坂)

12#
发表于 Post on 2017-7-5 12:44:10 | 只看该作者 Only view this author
mol 发表于 2017-7-5 12:39
组装的,主板是微星的,木有更新过哎,
您的意思是更新下bios试试?

实验室DELL的机器,出现诡异的问题(像是CPU性能突然下降)都是通过更新BIOS解决的。
你可以试一下。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:41 , Processed in 0.256715 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list