计算化学公社

 找回密码 Forget password
 注册 Register
Views: 285|回复 Reply: 1
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 请问不同的cpu可以组集群吗

[复制链接 Copy URL]

52

帖子

0

威望

869

eV
积分
921

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
现在做了一个三节点的集群
节点1是2颗8375c     72核
节点2是2颗8375c     72核
节点3是2颗8475b     96核
现在的情况是每个节点单独算 或者节点1节点2一起算都可以
三个节点一起算就会报错  报错信息是第三个节点 KILLED BY SIGNAL: 11 (Segmentation fault)
卖服务器的说是不同型号cpu不能一起运行,请问是这样吗  还是可以怎么处理一下能三节点一起运行

98

帖子

0

威望

511

eV
积分
609

Level 4 (黑子)

2#
发表于 Post on 2025-12-15 17:18:54 | 只看该作者 Only view this author
并非绝对:不同型号 CPU 并非不能组成集群共同运算,但CPU 架构 / 指令集差异、集群配置不当是导致第三节点报段错误(Signal 11)的核心原因:
8375c(Ice Lake,第三代 Intel Xeon)和 8475b(Sapphire Rapids,第四代 Intel Xeon)属于同架构但不同代的 CPU,指令集(如 AVX-512 子扩展、AMX)存在差异,直接混合运行未适配的程序会触发内存访问异常;而非 “不同型号 CPU 本身不能一起用”。
可以尝试:
1.增加ulimit -c unlimited试试
2.两个不同型号的处理器的机器,效率是有高低差别的,强行并行提升不了计算效率,就按照2+1的模式来使用

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-24 04:40 , Processed in 0.155180 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list