计算化学公社

标题: 用7950x等家用CPU组的机器与用服务器CPU组的比,365*24重负荷运行稳定性差别大么? [打印本页]

作者
Author:
bobosiji    时间: 2024-9-3 22:28
标题: 用7950x等家用CPU组的机器与用服务器CPU组的比,365*24重负荷运行稳定性差别大么?
本帖最后由 bobosiji 于 2024-9-3 22:37 编辑

托管机房离办公室很远,而且服务器会365*24重负荷甚至满载运行。不知用7950x攒的机器(比如,类似http://sobereva.com/444里的配置)是否容易宕机,比如每年宕机34次这种?
据说,家用CPU设计理念主要注重性能、频率。不太考虑365*24重负荷的使用场景:所以在该场景下使用,每年很可能会宕机多次?
请教大家有无7950x或其他家用CPU组的机器365*24重负荷甚至满载运行的经验?稳定性如何?比如一年大概宕机几次?(最好一并告知机器使用环境,比如是专用机房、还是普通办公室,环境温度是否经常超过30度?,,,)
  或者,用7950x等家用CPU组的机器与用服务器CPU组的机器比,365*24重负荷甚至满载运行的稳定性差别大么?
  多谢提点~

作者
Author:
sobereva    时间: 2024-9-4 08:11
应该关注的是主板、电源、散热等出问题概率远远大于CPU的因素,而不是CPU本身
作者
Author:
bobosiji    时间: 2024-9-4 08:49
sobereva 发表于 2024-9-4 08:11
应该关注的是主板、电源、散热等出问题概率远远大于CPU的因素,而不是CPU本身


作者
Author:
sss668800    时间: 2024-9-4 09:14
你们机房的机器不需要上机架?还是说可以在机架里面加托盘?

机架+托盘+台式机很奢侈的,要占据5u空间,我们这边是直接禁止这种方式托管的。


作者
Author:
wxyhgk    时间: 2024-9-4 09:19
本帖最后由 wxyhgk 于 2024-9-4 09:21 编辑

不会跌机,本人 AMD 5950x, 稳定运行两年多,需要注意的是硬件的兼容性,主板和电源用料都选好一些的,风扇猫扇,360水冷,如果为了保险起见可以上 480 水冷,然后用散热好的机箱(不要用所谓的海景房机箱,这种机箱有玻璃影响散热),为了防止断电,可以买一个 UPS。
作者
Author:
alanmei    时间: 2024-9-4 09:21
bobosiji 发表于 2024-9-4 08:49
**** 本内容被作者隐藏 ****

但凡是你真的分析服务器主板上的Mos散热和供电水平,都只能说是勉强够用,用料上完全不如家用主板的中端和高端型号,不然为什么那么多人买超微的板子还需要加散热片或者风扇,但是家用系列可能连铭瑄这种二线三线的牌子也不会做这种措施。至于电源?这个完全取决于组装者自己的水平,如果都是海韵Core或者Vertex起步,大概率还是很稳定的。散热器方面金钱豹的子品牌酷里奥成功拿下了风冷散热的前三名,猫头鹰更是静音王者,个人理解服务器产品上同厂家的产品至少不会更强。家用唯一不如服务器的是ECC内存,但是我自己也没遇见过自己的家用机因为耀斑这种事情宕机,我就不评价了。
作者
Author:
bobosiji    时间: 2024-9-4 09:24
sss668800 发表于 2024-9-4 09:14
你们机房的机器不需要上机架?还是说可以在机架里面加托盘?

机架+托盘+台式机很奢侈的,要占据5u空间, ...

可以上托盘。很多GPU机器(塔式服务器)也得4U,和台式机差不多吧?我们确实打算用塔式服务器机箱,这种看着像服务器。没见过机房托管家用机器的。。塔式服务器机箱高4U倒不是问题
作者
Author:
wxyhgk    时间: 2024-9-4 09:26
alanmei 发表于 2024-9-4 09:21
但凡是你真的分析服务器主板上的Mos散热和供电水平,都只能说是勉强够用,用料上完全不如家用主板的中端 ...

家用全部采用高端硬件基本就不会跌机,
电源:海韵,振华,其他的一律不选
风扇:猫头鹰
散热器:480水冷(水冷风扇卸下来全部换成猫扇)/猫头鹰散热器
内存:三星/皇家戟
硬盘:三星970,980,990pro/三星的oem盘/intel 905P,P5800x这种
作者
Author:
bobosiji    时间: 2024-9-4 09:27
alanmei 发表于 2024-9-4 09:21
但凡是你真的分析服务器主板上的Mos散热和供电水平,都只能说是勉强够用,用料上完全不如家用主板的中端 ...

“至于电源?这个完全取决于组装者自己的水平,如果都是海韵Core或者Vertex起步”:我们打算用服务器机箱,,,海韵、振华电源能用么?或者有好的适用服务器机箱的电源推荐么?多谢~
作者
Author:
bobosiji    时间: 2024-9-4 09:29
alanmei 发表于 2024-9-4 09:21
但凡是你真的分析服务器主板上的Mos散热和供电水平,都只能说是勉强够用,用料上完全不如家用主板的中端 ...

“我自己也没遇见过自己的家用机”:您了解的家用机有365*24重负荷使用经验么?如果有的话,能365*24重负荷稳定使用多久呢?
作者
Author:
wxyhgk    时间: 2024-9-4 09:32
bobosiji 发表于 2024-9-4 09:27
“至于电源?这个完全取决于组装者自己的水平,如果都是海韵Core或者Vertex起步”:我们打算用服务器机箱 ...

服务器机箱有的,可以买超微 CSE-745,这个有冗余电源,大概2000左右
作者
Author:
tiandikuoyuan    时间: 2024-9-4 09:59
只要配件没啥问题,不要贪便宜,常年运行没有问题;在办公室容易出问题的一个是网络,另一个是异常断电,经常断电容易导致电脑硬件异常
作者
Author:
alanmei    时间: 2024-9-4 10:04
bobosiji 发表于 2024-9-4 09:27
“至于电源?这个完全取决于组装者自己的水平,如果都是海韵Core或者Vertex起步”:我们打算用服务器机箱 ...

你们是打算7950X配服务器机箱?还是自己采购最新一代的Xeon6服务器CPU自己组装用服务器的2U/4U规格?后者是典型的超聚变、浪潮们的领域,因为很多服务器主板都是非标准规格的为这一类型的机箱设计的,相应的电源也是华为等等公司的定制冗余电源,然后用着8000-10000转的风扇狂吹。前者这个搭配就比较诡异了。。。我见识还是太窄
作者
Author:
bobosiji    时间: 2024-9-4 19:36
alanmei 发表于 2024-9-4 10:04
你们是打算7950X配服务器机箱?还是自己采购最新一代的Xeon6服务器CPU自己组装用服务器的2U/4U规格?后者 ...


作者
Author:
Entropy.S.I    时间: 2024-9-4 20:34
本帖最后由 Entropy.S.I 于 2024-9-5 08:53 编辑

半年前我实施过一例PC集群:
(, 下载次数 Times of downloads: 0)

配置如下:

1.     6台计算节点Type1:ASUS PRIME Z790 + 14700KF + RTX 4090D + 2*32GB DDR5 6400MT/s UDIMM + 1TB P44Pro + CX3 10GbE网卡 + 海韵Vertex GX1000
2.     1台计算节点Type2:ASUS ProArt Z790 + 14700KF + 2*RTX A6000 + NVLink-bridge + 4*32GB DDR5 5400MT/s UDIMM + 2TB P44Pro + CX3 10GbE网卡 + 振华LEADEX P2000W
3.     1台计算节点Type3:我开发的4*V100机架式服务器(8*V100的最高配置见http://bbs.keinsci.com/thread-47879-1-1.html),Gigabyte MF51-ES3 + Xeon W-2135 + 4*32GB DDR4 2666MT/s ECC-RDIMM + 4*V100-SXM2-16G + AOM-SXMV底板 + CX3 40GbE网卡 + 定制PCIe连接线 + 定制机箱 + (4+1)*500W CRPS电源
4.     1台登录+管理+存储+网关融合节点(Aka“主节点”):见去年发的帖子http://bbs.keinsci.com/thread-40486-1-1.html
5.     计算+存储+带内管理+带外管理融合网络:40G/10G/1G以太网(部分支持RDMA)
6.     UPS负责主节点和网络

已经稳定运行半年,期间计算节点Type 2宕机过一次,故障原因是CPU RAM不稳定,有人跑CPU-only的强化学习任务引发了此问题

至于你担心的机房空间问题,如今PC Farm很成熟了,7.5U高度19英寸机架式机箱可以放置3台ATX主板 + 7950X + 3.5槽RTX 4090 D + (1+1)CRPS的节点,散热没问题。不怕散热出问题,甚至可以压缩到6U6节点。以上说的都是现货,但不一定能在网购平台买到。



作者
Author:
yzh    时间: 2024-11-12 20:51
wxyhgk 发表于 2024-9-4 09:19
不会跌机,本人 AMD 5950x, 稳定运行两年多,需要注意的是硬件的兼容性,主板和电源用料都选好一些的,风扇 ...

有没有更新7950x,现在7950x价格下来了,b650m+ddr5的价格也不贵了
作者
Author:
wxyhgk    时间: 2024-11-13 11:04
yzh 发表于 2024-11-12 20:51
有没有更新7950x,现在7950x价格下来了,b650m+ddr5的价格也不贵了

没有,没钱
作者
Author:
yzh    时间: 2024-11-13 11:14
wxyhgk 发表于 2024-11-13 11:04
没有,没钱

好的,我本来打算更新到7950X的,最近硬件价格下来了;我的是b550m迫击炮wifi+ddr4 3600MHZ的64g内存,5950X。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3