|
服务器两块CPU,运行任务,总是有1个比另外1个热
请教一下, 我们有一台 Dell服务器(型号:G4GM6H2),装了两块 CPU(CPU型号:Intel(R) Xeon(R) CPU E5-4669 v4 @ 2.20GHz),
运行GROMACS,其中一个CPU的温度总是比另外1个高(如下图,红色圈是温度更高的CPU)。
我用两种方式去检测温度:
1、手摸
2、安装了 lm_sensors,用命令 sensors 去看
我之后想排查到底是散热的问题、还是CPU 和 主板的问题。
1、我先调换了两个CPU塔(散热)的位置,风扇正常转,满核运行任务, 靠近电源线的CPU更热(就是上图的红圈)。
sensors查看温度,显示 CPU1(80左右) 比 CPU0(65左右) 高15度 ,用手摸是 红色圈的 CPU 更热。
所以我认为左边的CPU 是 0,红色圈的 CPU 是 1。
另外我之后还尝试了 只用 6 个核 运行任务,平均分配 到每个CPU 就是 3个核, 红色圈位置的CPU 依旧更热。
2、调换了两块CPU的位置,风扇正常转,满核运行任务,依旧是靠近电源线的CPU更热。
sensors查看温度,显示 CPU1(80左右) 比 CPU0(60左右) 高 20 度 ,用手摸是 红色圈的 CPU 更热。
但是我不确定CPU编号是不是按照CPU卡槽编的,我认为是按照 CPU 卡槽 编 的,因为 sensors 查看和手摸都是红色圈位置的 CPU 热,
如果不是按照CPU卡槽编的,那么 应该是 左边的 CPU 热。
我们目前的推论是 主板有问题,因为 不管CPU 是否调换位置,总是固定的红色圈位置 温度 更高。
根据以上情况,想知道以下几个问题:
1、主板坏的概率有多大(主板较贵,但是主板确实有问题的话,我们还是要换的)?
2、CPU 是否有 问题 ?
3、满核运行,红色圈的CPU 达到80度左右,没有满核运行时,红色圈的CPU 就达到了 70 度,这个温度是正常的吗 ?
4、看其他帖子,有说可以改一下系统 BIOS,两个CPU 温度就 一致 了,这个可行吗?
5、能不能改造一下,例如 冷凝管一类的,让 CPU 散热更快 ,但是dell 经销商 说没法改善散热性能了。
|
|