计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: Hanio
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 关于三代至强es的稳定性

[复制链接 Copy URL]

232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

31#
发表于 Post on 2022-1-29 21:11:11 | 只看该作者 Only view this author
天然呆 发表于 2022-1-29 19:46
超微主板应该也可以兼容猫扇,我用的是超微X11 DAI-N。使用ipmitool设置风扇上下限。不过关键一步,设置 ...

这个感情好,现在放在办公室还是有点吵。请问能指导一下怎么使用ipmi吗?(centos 8.3)

34

帖子

0

威望

1171

eV
积分
1205

Level 4 (黑子)

32#
发表于 Post on 2022-1-29 23:06:08 | 只看该作者 Only view this author
本帖最后由 天然呆 于 2022-1-29 23:08 编辑
wolfli369 发表于 2022-1-29 21:11
这个感情好,现在放在办公室还是有点吵。请问能指导一下怎么使用ipmi吗?(centos 8.3)

我输入的命令应该是ipmitool sensor thresh FAN1 lower,下面的是设置风扇转速
100   200  300
ipmitool sensor thresh FAN1 upper
1500  1700 1900
以此为例,设置每个风扇的转速上下限,设置完成之后关机,拔电源线,等五分钟左右重启,应该就可以了。风扇转速上限你可以根据自己的最大转速来调节,我用的是猫扇两个是散热器自带的,两个是2000 转速的工业扇,都可以自动调控,放办公室基本不吵。

232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

33#
发表于 Post on 2022-1-30 11:22:46 | 只看该作者 Only view this author
天然呆 发表于 2022-1-29 23:06
我输入的命令应该是ipmitool sensor thresh FAN1 lower,下面的是设置风扇转速
100   200  300
ipmitoo ...

收到,谢谢

29

帖子

0

威望

68

eV
积分
97

Level 2 能力者

34#
发表于 Post on 2022-2-16 13:56:47 | 只看该作者 Only view this author
本帖最后由 StephenCurry 于 2022-2-16 13:58 编辑

老师好,能否系统满载时候查看一下供电温度,命令是
sudo ipmitool sensor list
其中CPU1_VRMIN Temp和CPU2_VRMIN Temp就是供电温度

232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

35#
发表于 Post on 2022-2-16 16:29:55 | 只看该作者 Only view this author
本帖最后由 wolfli369 于 2022-2-16 16:31 编辑
StephenCurry 发表于 2022-2-16 13:56
老师好,能否系统满载时候查看一下供电温度,命令是
sudo ipmitool sensor list
其中CPU1_VRMIN Temp和 ...

图1和2是p2k.popt全核并行进行集合优化30分钟后样子
图3是2小时之后的结果。已经打算给CPU1 MOS添加散热片

202202161629211460..png (58.59 KB, 下载次数 Times of downloads: 29)

图3

图3

2.jpg (517.43 KB, 下载次数 Times of downloads: 36)

图1

图1

1.jpg (275.91 KB, 下载次数 Times of downloads: 27)

图2

图2

29

帖子

0

威望

68

eV
积分
97

Level 2 能力者

36#
发表于 Post on 2022-2-16 16:35:35 | 只看该作者 Only view this author
wolfli369 发表于 2022-2-16 16:29
图1和2是p2k.popt全核并行进行集合优化30分钟后样子
图3是2小时之后的结果。已经打算给CPU1 MOS添加散热 ...

86度吗,感觉比我好。我这里广州,破百了。你那室温多少度啊

29

帖子

0

威望

68

eV
积分
97

Level 2 能力者

37#
发表于 Post on 2022-2-16 16:41:19 | 只看该作者 Only view this author
wolfli369 发表于 2022-2-16 16:29
图1和2是p2k.popt全核并行进行集合优化30分钟后样子
图3是2小时之后的结果。已经打算给CPU1 MOS添加散热 ...

广州室温20度,全核计算时候CPU功率270W,感觉突破不了,不知道是不是主板限制。CPU温度70度,供电102度。整机功率900-1000W(16条内存,双路CPU,没有显卡!)给后来童鞋参考。

232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

38#
发表于 Post on 2022-2-16 16:58:36 | 只看该作者 Only view this author
StephenCurry 发表于 2022-2-16 16:41
广州室温20度,全核计算时候CPU功率270W,感觉突破不了,不知道是不是主板限制。CPU温度70度,供电102度 ...

一直没有测试上整机满载功率,MOS温度有时能达到105(室温10度)。满载连续运行18天也没有出现问题。先马黑洞玻璃侧透机箱散热对于8375C ES不是很友好,打开玻璃侧板温度能低5度左右。

29

帖子

0

威望

68

eV
积分
97

Level 2 能力者

39#
发表于 Post on 2022-2-16 17:04:17 | 只看该作者 Only view this author
wolfli369 发表于 2022-2-16 16:58
一直没有测试上整机满载功率,MOS温度有时能达到105(室温10度)。满载连续运行18天也没有出现问题。先马 ...

我是8375c正式版,机箱是超微743AC-1K26B-SQ。你室温10度的话,感觉散热问题比我还严重啊。当然,供电散热通常是依赖风道的,打开侧板增加散热,但是也失去风道,供电温度不会下降很多的。我的机箱测试下来也是这个情况

232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

40#
发表于 Post on 2022-2-16 17:11:37 | 只看该作者 Only view this author
StephenCurry 发表于 2022-2-16 17:04
我是8375c正式版,机箱是超微743AC-1K26B-SQ。你室温10度的话,感觉散热问题比我还严重啊。当然,供电散 ...

刚买时室温25度,满载5天,机器也没有发现问题。稍后发现CPU温度稍高,自己加装4个猫头鹰分散,温度就下降了。打算给CPU1加装一个MOS散热片,刚找到卖家。

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

41#
发表于 Post on 2022-2-16 17:38:43 | 只看该作者 Only view this author
StephenCurry 发表于 2022-2-16 17:04
我是8375c正式版,机箱是超微743AC-1K26B-SQ。你室温10度的话,感觉散热问题比我还严重啊。当然,供电散 ...

供电温度就这样了,2U机器用暴力风扇也好不到哪去,除非是像SD650V2那样给供电上水冷再限制电流

232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

42#
发表于 Post on 2022-2-16 18:47:03 | 只看该作者 Only view this author
biogon 发表于 2022-2-16 17:38
供电温度就这样了,2U机器用暴力风扇也好不到哪去,除非是像SD650V2那样给供电上水冷再限制电流

这样的改造需要一定的技术,供电测温度再100度左右应该没问题,很多显卡的供电温度更高,也没有发生事故,我只是类比一下

29

帖子

0

威望

68

eV
积分
97

Level 2 能力者

43#
发表于 Post on 2022-2-16 21:16:33 | 只看该作者 Only view this author
wolfli369 发表于 2022-2-16 17:11
刚买时室温25度,满载5天,机器也没有发现问题。稍后发现CPU温度稍高,自己加装4个猫头鹰分散,温度就下 ...

老师,请问能私信一下MOS散热片商家吗?

60

帖子

0

威望

702

eV
积分
762

Level 4 (黑子)

44#
发表于 Post on 2022-2-16 23:54:11 | 只看该作者 Only view this author
wolfli369 发表于 2022-1-27 22:40
以前也有高手说过VRM散热的问题,考虑到实际使用中没有出现问题,我就相信超的微工程师了。室温20度 ...

老师您好,我最近也买了一台8375C ES的服务器,系统我安装的是centos8.4 但是在参考http://bbs.keinsci.com/thread-21608-1-1.html安装cp2k8.2时,在Getting proc arch info using OpenBLAS tools时会出现错误,错误如图 ,后来在OpenBLAS文件夹使用make BINARY=64 CC=gcc FC=gfortran HOSTCC=gcc TARGET=PRESCOTT后该错误消失,但最终psmp的测试文件全部不能通过,ssmp可以通过部分,在使用自己的算例测试时出现了附件中的错误, cp2k.err (108.49 KB, 下载次数 Times of downloads: 1) ,不知道您安装CP2K8.2的时候有没有这个问题,还有可否介绍下您结合intel2018安装CP2K8.2的方法啊。谢谢您了。


232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

45#
发表于 Post on 2022-2-17 11:17:25 | 只看该作者 Only view this author
bblovelp 发表于 2022-2-16 23:54
老师您好,我最近也买了一台8375C ES的服务器,系统我安装的是centos8.4 但是在参考http://bbs.keinsci.c ...

同样遇到Xeon 8375C ES使用toolchain安装cp2k 8.2出现getarch_2nd报错(安装9.1倒没有出现报错,并且识别CPU型号,但是elpa需要自己编译),怀疑时CPU型号不能识别所知,解决办法是重新安装(实在不行,就删除文件,在别的目录下安装),还可选择MKL就不要用Openblas了,--with-openblas=no,反复安装几次就行了。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 07:04 , Processed in 0.169521 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list