计算化学公社

 找回密码 Forget password
 注册 Register
Views: 16448|回复 Reply: 42
打印 Print 上一主题 Last thread 下一主题 Next thread

[其它] 2696v3平台过热报警,正常吗?

[复制链接 Copy URL]

53

帖子

0

威望

1237

eV
积分
1290

Level 4 (黑子)

首先感谢社长sobereva,无论是硬件配置还是VASP编译,sob大的帖子和视频,使我少走很多弯路 。(P.S. 初级量子化学培训班一票难求)
按推荐配置买了套2696v3平台,发现mpirun -np 36 vasp时,长鸣报警,查了下X10DRL-I主板手册,应该是CPU2温度过热
这个主板结构造成CPU1的风吹进CPU2,所以CPU2温度明显比CPU1高。
我尝试增加了机箱风扇,效果不明显;只有开空调26度以下,才能控制住CPU2温度报警。
我想调高报警温度阈值,BIOS没发现设置选项
安装了ipmitool,如附图,调高CPU2 Temp阈值(可以与CPU1对比),不起作用,我的操作不对???
额外还发现Vcpu1VRM Temp (Voltage Regulator Module 电压调节模组???)异常的高,暂时还不懂这个选项是啥意思

总结一下,我的问题如下:
1. 大家的2696v3服务器在满载时会报警吗?购买时,发现经销商使用翻新硬盘、15年的拆机内存条,所以对购买的机器品质有些怀疑。
2. 遇到温度过热,大家怎么解决的?

敬请赐教,谢谢!!!

ipmitool_1.jpg (80.99 KB, 下载次数 Times of downloads: 95)

ipmitool阈值

ipmitool阈值

ipmitool_2.jpg (82.55 KB, 下载次数 Times of downloads: 83)

ipmitool服务

ipmitool服务

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
发表于 Post on 2019-8-24 23:29:25 来自手机 | 只看该作者 Only view this author
找经销商撕逼,或者提升空调功率,或者多装风扇并合理调整风扇进出风方向。

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

3#
发表于 Post on 2019-8-24 23:30:18 来自手机 | 只看该作者 Only view this author
额外提一句,某些商家的机器,卖好几万,是有一定道理的。

5万

帖子

99

威望

5万

eV
积分
112351

管理员

公社社长

4#
发表于 Post on 2019-8-25 00:21:43 | 只看该作者 Only view this author
我的2*2696v3一直用到现在,从没有遇到过过热报警问题
报警阈值设置问题可以发邮件问超微的客服
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

41

帖子

1

威望

1934

eV
积分
1996

Level 5 (御坂)

5#
发表于 Post on 2019-8-25 01:23:30 | 只看该作者 Only view this author
最里面的CPU装个240水冷,靠外的CPU装个猫扇,一水一风,阴阳调和,稳得很。

评分 Rate

参与人数
Participants 1
eV +2 收起 理由
Reason
复前行79 + 2 我很赞同

查看全部评分 View all ratings

230

帖子

0

威望

2653

eV
积分
2883

Level 5 (御坂)

6#
发表于 Post on 2019-8-25 08:38:07 | 只看该作者 Only view this author
换12cm散热器,大风量风扇

不要上水冷

超微的板子用ipmi工具调高转速

279

帖子

0

威望

2271

eV
积分
2550

Level 5 (御坂)

7#
发表于 Post on 2019-8-25 09:55:28 | 只看该作者 Only view this author
CPU2温度77度,离high85度还差不少;Vcpu1VRM温度也不到high105度,这就报警了?
另外,mpirun -np 36 vasp时,除了长鸣报警,服务器还有其他提示信息么(声音、屏幕都行)?

53

帖子

0

威望

1237

eV
积分
1290

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2019-8-25 10:08:45 | 只看该作者 Only view this author
abin 发表于 2019-8-24 23:29
找经销商撕逼,或者提升空调功率,或者多装风扇并合理调整风扇进出风方向。

我观察了下,先马泰坦 + X10DRL-I主板 ,只有CPU2附近热。
我加装了CPU2附近的两个排气扇,没作用。
我得找经销商聊聊了

53

帖子

0

威望

1237

eV
积分
1290

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2019-8-25 10:10:40 | 只看该作者 Only view this author
sobereva 发表于 2019-8-25 00:21
我的2*2696v3一直用到现在,从没有遇到过过热报警问题
报警阈值设置问题可以发邮件问超微的客服

谢谢回复。
同样的配置,别人没问题,就我的报警,那就是我的机器的问题了。

53

帖子

0

威望

1237

eV
积分
1290

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2019-8-25 10:12:34 | 只看该作者 Only view this author
knight1014 发表于 2019-8-25 01:23
最里面的CPU装个240水冷,靠外的CPU装个猫扇,一水一风,阴阳调和,稳得很。

谢谢回复。
CPU + 水冷,没怎么接触过。
这是最后的办法了

113

帖子

0

威望

3122

eV
积分
3235

Level 5 (御坂)

11#
发表于 Post on 2019-8-25 11:11:10 | 只看该作者 Only view this author
我的简单的双路(主板是X10DAL-i)也是类似,CPU+GPU热量太大,只能把一侧的机箱板子拆掉后,在空调26度不变情况,满载的的情况下,前段的CPU温度是90多,后段的CPU是60多,恼火得很。

53

帖子

0

威望

1237

eV
积分
1290

Level 4 (黑子)

12#
 楼主 Author| 发表于 Post on 2019-8-25 11:19:33 | 只看该作者 Only view this author
本帖最后由 CrysLantZ 于 2019-8-25 11:25 编辑
qinzhong605 发表于 2019-8-25 11:11
我的简单的双路(主板是X10DAL-i)也是类似,CPU+GPU热量太大,只能把一侧的机箱板子拆掉后,在空调26度不 ...

谢谢回复。
CPU2温度90+,主板不报警吗?
我只有CPU,没GPU。CPU2温度高,总是持续报警,吵的烦。
其实吧,我主要怕硬件(比如主板、CPU)有质量问题
另外,报警阈值在75?怎么提高阈值?
ipmi调整温度阈值,不起作用。重启后,又回复原值。可能是我的设置有问题

53

帖子

0

威望

1237

eV
积分
1290

Level 4 (黑子)

13#
 楼主 Author| 发表于 Post on 2019-8-25 11:23:38 | 只看该作者 Only view this author
bobosiji 发表于 2019-8-25 09:55
CPU2温度77度,离high85度还差不少;Vcpu1VRM温度也不到high105度,这就报警了?
另外,mpirun -np 36 vas ...

除了长鸣报警,没有其它提示(我是小白)。
可以安装lm-sensors或impi监测CPU温度。
你看到没达到阈值,是因为我调高阈值了,你可以对比下CPU1和CPU2的设置,默认值是相同的。

53

帖子

0

威望

1237

eV
积分
1290

Level 4 (黑子)

14#
 楼主 Author| 发表于 Post on 2019-8-25 11:33:54 | 只看该作者 Only view this author
本帖最后由 CrysLantZ 于 2019-8-25 11:35 编辑
一颗赛艇 发表于 2019-8-25 08:38
换12cm散热器,大风量风扇

不要上水冷

谢谢回复。
经销商闷不吭声把我要求的酷冷至尊T400i换成超频三风扇了,我查了下价位差不多,就没折腾。
也许是CPU风扇散热不行?
我在先马泰坦机箱里装了4个风扇了,其中CPU2附近2个排气扇
高温报警时,ipmi检测风扇达到了这两个风扇的满速
排除主板问题后,我考虑更换个好点的CPU2风扇或水冷

3098

帖子

28

威望

1万

eV
积分
16892

Level 6 (一方通行)

15#
发表于 Post on 2019-8-25 14:48:55 | 只看该作者 Only view this author
2696v3的主频并不很高,经验上一直不咋热,不理解会热到报警。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 08:02 , Processed in 0.203393 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list