计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1188|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[硬件相关] 使用高功耗CPU(~300W)的双路塔式服务器散热问题

[复制链接 Copy URL]

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
如题,最近遇到一8375C机器高负载重启,虽大致确定是电源风扇不转导致电源过热而重启,但还是想和大家讨论请教一下高功耗服务器CPU散热相关问题

1. CPU散热:如果使用猫头鹰U12S散热器,那么风道为从下向上吹,配合使用能从底部无障碍进风的电源前置垂直风道机箱(例如鑫谷孟菲斯、机械大师C34Pro)相较于传统前进上出后出是否能较大程度改善CPU温度?是否有必要使用较高性能的14cm风扇作为排风风扇?实测8375C(300W)+614PC机箱+前置20cm原装风扇进气上置双14cm风扇排气,CPU满载时,上方两个1200RPM的追风者F140MP风扇无法把热风及时排出,表现为机箱侧板上部很热,同时打开侧板大幅改善CPU温度。虽然2个A12x25风扇+U12S塔体大致能将全核满载的8375C压在80度以下,但是在系统日志中仍然时不时看到核心过热降频的报告,在非全核满载时个别核心过热现象出现得更加频繁,个人认为有必要进一步优化风道

2. MOS管散热:8375C+X12DAi-N主板CPU满载300W时,CPU0的MOS管温度大约为95℃,CPU1的MOS由于后置出风风扇的存在大约为90℃。考虑到X12-DAi的设计最大TDP为270W,当前已经是解锁了功耗的情况,是否有必要加强MOS散热?有无易于操作、维护的加强MOS散热的方式?

3. 内存散热:垂直风道情况下内存基本无法通过机箱风道散热,在内存负载较高的任务中内存温度能达到70+,这对于3200频率的JEDEC内存是否仍是能够稳定工作不出错的温度?是否有必要增强散热?

4. PCIE4.0固态硬盘散热:4.0固态硬盘普遍发热较大,三星PM9A1/980Pro裸盘在上述机箱环境中持续满载读写,实测主控温度可轻松突破90度,目前使用密闭式转接卡加小涡轮风扇主动散热效果不错但噪音颇大,请问各位老师是否有更好的散热方案?被动散热的固态硬盘散热器能否解决硬盘连续满载的发热?

5. 电源余量:手上这台8375C满载时纸面上能看到的功率为300Wx2+40Wx2,后者为两组内存的功耗。此时功率已经为760W,再考虑到其他硬件消耗的电能和CPU、内存供电转化过程中的损耗,是否有必要在1000W电源的基础上再留出一些余量?实测在电源风扇正常工作的情况下,机器满载时电源也是比较热的

非常感谢各位老师~


2301

帖子

1

威望

5477

eV
积分
7798

Level 6 (一方通行)

2#
发表于 Post on 2023-6-24 07:58:44 | 只看该作者 Only view this author
打电话给卖家,
上门来处理风扇散热……

没有机房,就多用风扇……

要不然,别碰这种热宝宝……
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

87

帖子

1

威望

1693

eV
积分
1800

Level 5 (御坂)

3#
发表于 Post on 2023-6-24 13:22:36 | 只看该作者 Only view this author
和我的机器好像。
我的机器顶部有三个风压扇(买几箱顺便买的追风者普通风扇,找客服要的优惠),下面(电源旁)又加了一个(和sob老师那个一样),大致是后->前;下->上的风道,差不多满载80以下未出现降频,现在夏天了能高到85,但未发现降频
上风道可以排出热量的,最烫的就是上面的铁网
硬盘温度过高是真的,加了散热马甲效果一般,可以让商家在硬盘上加个风扇散热
电源1000w绰绰有余了吧
其实8375C很好压的,便宜的金钱豹散热都没问题,如果还是出现过热降频考虑下别的因素,比如(直接找客服吧

232

帖子

1

威望

3333

eV
积分
3585

Level 5 (御坂)

4#
发表于 Post on 2023-6-24 17:26:08 | 只看该作者 Only view this author
本帖最后由 wolfli369 于 2023-7-3 20:49 编辑

1. 机箱很重要。先前机箱使用先马黑洞玻璃侧透版,xeon8375C ES双路(TDP330W),猫头鹰散热器,室温25度左右,CPU满载在85度左右;但是室温到35度以上,直接热死机。后改成追风者620PC,同样风道和配置,CPU满载65度以内。
2. MOS温度过高可以增加MOS散热,这方面很多淘宝卖家都可以做,需要稍微动手一下,最好还是合理使用风道。
3. xeon 83系列CPU慎重使用avx512指令集,发热太厉害,所以编译软件一定要谨慎合理使用相应指令集。对于cp2k-2023.1来说,avx512在跑分子动力学方面没有带来明显好处,很多情况下还起到相反效果(这个不严谨测试)。
4. 三星固态发热都不低。一般都是采用散热片,同时在机箱底部增加散热风扇。
5. 电源选择社长推荐的牌子1000W足够,哪怕是330W的ES的CPU,在cp2k满载峰值能达到920W,平时使用没遇到问题,不放心可以增加到1200左右。如果后期上GPU卡,电源就直接到2000W就行,需要合理规划PCI通道的使用。

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2023-6-24 21:20:40 | 只看该作者 Only view this author
wolfli369 发表于 2023-6-24 17:26
1. 机箱很重要。先前机箱使用先马黑洞玻璃侧透版,xeon8375C ES双路(TDP330W),猫头鹰散热器,室温25度左 ...

620PC是那个能装双主板的超大全塔嘛,散热这么强?满载50度以下有点难以置信

改善MOS散热我看大部分都是贴一个铝散热片到MOS上,但是X12DAi这个板子已经是前后散热片都配齐了。往MOS上加水冷…感觉第一太夸张了毕竟只是个MOS而已,第二这种没有大厂背书的水冷说实话有点不敢用(更何况机器是一个不那么懂硬件的朋友实际在用)。不知道有没有介于两者之间的选择,比如规模比原装散热片更大的、带热管的MOS散热器推荐?

三星固态硬盘的发热散热“片”(淘宝几块钱那种)是肯定压不住的,我比较关心的是利民新出的那种固态硬盘塔式散热器能不能在机箱里面长时间压制硬盘发热,毕竟是被动散热,把热容吃完了之后的散热情况要打个问号,想问问是否有老师有这方面的使用经验

电源可能是我多虑了,但是大家都说好的海韵GX1000轻度使用一年风扇竟然坏了,用手拨以下才转,转起来之后再p95就没事了,实在让人有些大跌眼镜。

232

帖子

1

威望

3333

eV
积分
3585

Level 5 (御坂)

6#
发表于 Post on 2023-6-24 21:42:21 | 只看该作者 Only view this author
1)620PC机箱你可以试一下。
2)主板自带散热片你懂的;更大的散热片某宝上有
3)利民散热器没有用过,不发表评论。
4)海韵电源只用过两个,质量问题无法下结论。

5万

帖子

99

威望

5万

eV
积分
112384

管理员

公社社长

7#
发表于 Post on 2023-6-25 04:22:12 | 只看该作者 Only view this author
海韵GX1000我目前用过两个,都一直非常正常。你的情况属于rp问题,品控再好的产品也没法做到完全0返修。海韵的口碑已经算是最好的档次了。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

232

帖子

1

威望

3333

eV
积分
3585

Level 5 (御坂)

8#
发表于 Post on 2023-7-3 20:50:31 | 只看该作者 Only view this author
DoorBell 发表于 2023-6-24 21:20
620PC是那个能装双主板的超大全塔嘛,散热这么强?满载50度以下有点难以置信

改善MOS散热我看大部分都 ...

不要意思,追风者620pc机箱配合猫头鹰散热器能压到65度

126

帖子

1

威望

416

eV
积分
562

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2023-7-5 01:05:40 | 只看该作者 Only view this author
本帖最后由 DoorBell 于 2023-7-5 01:09 编辑
wolfli369 发表于 2023-7-3 20:50
不要意思,追风者620pc机箱配合猫头鹰散热器能压到65度

仔细看了一下,似乎追风者现在的产品名字中带有“620”字样的大致有两个,一个是PK620,另一个是PK620工作站版,后者的整体形态看起来更加为工作站特化,支持2U冗余电源和比EEB规格更大的主板。不知道您指的是哪一个产品,能否上传照片看一下具体是什么风道形态呢?另外请问CPU0和CPU1的各项温度都比较一致吗(614PC默认前进风上后出风,CPU1温度高5-10度)?非常感谢!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-25 14:34 , Processed in 0.220883 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list