请选择 进入手机版 | 继续访问电脑版

计算化学公社

 找回密码
 现在注册!
查看: 1047|回复: 31

[其它] 2696v3平台过热报警,正常吗?

[复制链接]

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

发表于 2019-8-24 22:44:01 | 显示全部楼层 |阅读模式
首先感谢社长sobereva,无论是硬件配置还是VASP编译,sob大的帖子和视频,使我少走很多弯路 。(P.S. 初级量子化学培训班一票难求)
按推荐配置买了套2696v3平台,发现mpirun -np 36 vasp时,长鸣报警,查了下X10DRL-I主板手册,应该是CPU2温度过热
这个主板结构造成CPU1的风吹进CPU2,所以CPU2温度明显比CPU1高。
我尝试增加了机箱风扇,效果不明显;只有开空调26度以下,才能控制住CPU2温度报警。
我想调高报警温度阈值,BIOS没发现设置选项
安装了ipmitool,如附图,调高CPU2 Temp阈值(可以与CPU1对比),不起作用,我的操作不对???
额外还发现Vcpu1VRM Temp (Voltage Regulator Module 电压调节模组???)异常的高,暂时还不懂这个选项是啥意思

总结一下,我的问题如下:
1. 大家的2696v3服务器在满载时会报警吗?购买时,发现经销商使用翻新硬盘、15年的拆机内存条,所以对购买的机器品质有些怀疑。
2. 遇到温度过热,大家怎么解决的?

敬请赐教,谢谢!!!

ipmitool阈值

ipmitool阈值

ipmitool服务

ipmitool服务

181

帖子

0

威望

1008

eV
积分
1189

Level 4 (黑子)

发表于 2019-8-24 23:29:25 来自手机 | 显示全部楼层
找经销商撕逼,或者提升空调功率,或者多装风扇并合理调整风扇进出风方向。

181

帖子

0

威望

1008

eV
积分
1189

Level 4 (黑子)

发表于 2019-8-24 23:30:18 来自手机 | 显示全部楼层
额外提一句,某些商家的机器,卖好几万,是有一定道理的。

2万

帖子

25

威望

2万

eV
积分
45911

管理员

公社社长

发表于 2019-8-25 00:21:43 | 显示全部楼层
我的2*2696v3一直用到现在,从没有遇到过过热报警问题
报警阈值设置问题可以发邮件问超微的客服
北京科音自然科学研究中心:http://www.keinsci.com  致力于计算化学的发展和传播,不定期开办各层次量子化学、分子动力学、波函数分析与Multiwfn程序等主题的培训。欢迎加入“北京科音”微信公众号获取培训最新消息和计算化学资讯
思想家公社QQ群,1号:18616395,2号:466017436。达5000人,专门交流理论、计算化学。两个群讨论范畴相同,可加入任意其一但不可都加入,申请信息必须注明具体研究方向,否则一概不批。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(最流行的量子化学波函数分析程序)

此账号为诸Sobereva共用
Money and papers are rubbish, get a real life!

26

帖子

0

威望

638

eV
积分
664

Level 4 (黑子)

发表于 2019-8-25 01:23:30 | 显示全部楼层
最里面的CPU装个240水冷,靠外的CPU装个猫扇,一水一风,阴阳调和,稳得很。

评分

参与人数 1eV +2 收起 理由
复前行79 + 2 我很赞同

查看全部评分

174

帖子

0

威望

1390

eV
积分
1564

Level 5 (御坂)

发表于 2019-8-25 08:38:07 | 显示全部楼层
换12cm散热器,大风量风扇

不要上水冷

超微的板子用ipmi工具调高转速

48

帖子

0

威望

354

eV
积分
402

Level 3 能力者

发表于 2019-8-25 09:55:28 | 显示全部楼层
CPU2温度77度,离high85度还差不少;Vcpu1VRM温度也不到high105度,这就报警了?
另外,mpirun -np 36 vasp时,除了长鸣报警,服务器还有其他提示信息么(声音、屏幕都行)?

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

 楼主| 发表于 2019-8-25 10:08:45 | 显示全部楼层
abin 发表于 2019-8-24 23:29
找经销商撕逼,或者提升空调功率,或者多装风扇并合理调整风扇进出风方向。

我观察了下,先马泰坦 + X10DRL-I主板 ,只有CPU2附近热。
我加装了CPU2附近的两个排气扇,没作用。
我得找经销商聊聊了

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

 楼主| 发表于 2019-8-25 10:10:40 | 显示全部楼层
sobereva 发表于 2019-8-25 00:21
我的2*2696v3一直用到现在,从没有遇到过过热报警问题
报警阈值设置问题可以发邮件问超微的客服

谢谢回复。
同样的配置,别人没问题,就我的报警,那就是我的机器的问题了。

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

 楼主| 发表于 2019-8-25 10:12:34 | 显示全部楼层
knight1014 发表于 2019-8-25 01:23
最里面的CPU装个240水冷,靠外的CPU装个猫扇,一水一风,阴阳调和,稳得很。

谢谢回复。
CPU + 水冷,没怎么接触过。
这是最后的办法了

21

帖子

0

威望

524

eV
积分
545

Level 4 (黑子)

发表于 2019-8-25 11:11:10 | 显示全部楼层
我的简单的双路(主板是X10DAL-i)也是类似,CPU+GPU热量太大,只能把一侧的机箱板子拆掉后,在空调26度不变情况,满载的的情况下,前段的CPU温度是90多,后段的CPU是60多,恼火得很。

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

 楼主| 发表于 2019-8-25 11:19:33 | 显示全部楼层
本帖最后由 CrysLantZ 于 2019-8-25 11:25 编辑
qinzhong605 发表于 2019-8-25 11:11
我的简单的双路(主板是X10DAL-i)也是类似,CPU+GPU热量太大,只能把一侧的机箱板子拆掉后,在空调26度不 ...

谢谢回复。
CPU2温度90+,主板不报警吗?
我只有CPU,没GPU。CPU2温度高,总是持续报警,吵的烦。
其实吧,我主要怕硬件(比如主板、CPU)有质量问题
另外,报警阈值在75?怎么提高阈值?
ipmi调整温度阈值,不起作用。重启后,又回复原值。可能是我的设置有问题

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

 楼主| 发表于 2019-8-25 11:23:38 | 显示全部楼层
bobosiji 发表于 2019-8-25 09:55
CPU2温度77度,离high85度还差不少;Vcpu1VRM温度也不到high105度,这就报警了?
另外,mpirun -np 36 vas ...

除了长鸣报警,没有其它提示(我是小白)。
可以安装lm-sensors或impi监测CPU温度。
你看到没达到阈值,是因为我调高阈值了,你可以对比下CPU1和CPU2的设置,默认值是相同的。

15

帖子

0

威望

51

eV
积分
66

Level 2 能力者

 楼主| 发表于 2019-8-25 11:33:54 | 显示全部楼层
本帖最后由 CrysLantZ 于 2019-8-25 11:35 编辑
一颗赛艇 发表于 2019-8-25 08:38
换12cm散热器,大风量风扇

不要上水冷

谢谢回复。
经销商闷不吭声把我要求的酷冷至尊T400i换成超频三风扇了,我查了下价位差不多,就没折腾。
也许是CPU风扇散热不行?
我在先马泰坦机箱里装了4个风扇了,其中CPU2附近2个排气扇
高温报警时,ipmi检测风扇达到了这两个风扇的满速
排除主板问题后,我考虑更换个好点的CPU2风扇或水冷

2537

帖子

23

威望

8766

eV
积分
11763

Level 6 (一方通行)

发表于 2019-8-25 14:48:55 | 显示全部楼层
2696v3的主频并不很高,经验上一直不咋热,不理解会热到报警。
您需要登录后才可以回帖 登录 | 现在注册!

本版积分规则

手机版|北京科音自然科学研究中心|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949-1号 )

GMT+8, 2019-9-21 09:28 , Processed in 0.174196 second(s), 27 queries .

快速回复 返回顶部 返回列表