计算化学公社

标题: 请问大家EPYC服务器centos系统查看sensors命令 [打印本页]

作者
Author:
dingniu2    时间: 2022-12-2 10:40
标题: 请问大家EPYC服务器centos系统查看sensors命令
请问大家EPYC服务器centos系统查看sensors命令后不只显示CPU温度(k10temp温度),还有个bnxt_en-pci温度,请问这个是什么温度,怎么这么高?

作者
Author:
RFBI    时间: 2022-12-2 18:46
用glances看到的是这样子的,7R32这颗CPU48个核心,应该是6块8核心,所以温度可以看到6个独立的温度
作者
Author:
lqs    时间: 2024-5-7 09:08
同样的问题,网卡温度显示74°左右,CPU也就才35°

作者
Author:
lqs    时间: 2024-5-7 09:09
本帖最后由 lqs 于 2024-5-7 09:10 编辑
lqs 发表于 2024-5-7 09:08
同样的问题,网卡温度显示74°左右,CPU也就才35°

不知楼主解决了没有,Ubuntu 22.04,主板MZ73-LM0-000,cpu AMD EPYC 9654
作者
Author:
Hostiphre    时间: 4 day ago
同问,以前开空调跑bnxt_en-pci就80多,装了个水冷k10temp降下去了,可这货是随开机时长增长的,cpu空闲时飙到100度,现在还没找到在哪里,但怀疑在cpu里,因为它有2个
作者
Author:
zdb    时间: 4 day ago
本帖最后由 zdb 于 2024-11-19 11:49 编辑

bnxt_en-pci应该是网卡,这个温度的确很高,作为服务器厂商,在之前没有注意到这块的时候,技嘉MZ73-LM0主板因为高温网卡故障换了两次,尤其是在处理器使用液冷的时候,很多的主板芯片温度比较高,需要额外加散热
sensor在AMD的处理器上有很多时候不全,安装一个ipmitool,centos可以直接yum install,这个对风扇转速,主板芯片温度监控的更全面
作者
Author:
snljty2    时间: 4 day ago
本帖最后由 snljty2 于 2024-11-19 13:26 编辑

Zen3 Zen4架构等(Zen2我忘了)如果要监控CPU温度,可以考虑使用CoreFreq。解压后编译安装,如果报错就代码第13381行
  1. ->state
复制代码
改成
  1. ->__state
复制代码
,然后
  1. make; make install
复制代码
。之后
  1. systemctl daemon-reload; insmod corefreqk.ko; systemctl enable corefreqd
复制代码
即可。用
  1. corefreq-cli
复制代码
命令查看温度。不过这个进程要占一些后台CPU,不用的时候建议
  1. systemctl stop corefreqd
复制代码
关掉。以及重启机器后需要
  1. insmod /usr/lib/modules/4.18.0-477.10.1.el8_8.x86_64/extra/corefreqk.ko
复制代码
之类的,具体文件位置因系统而异。然后再
  1. systemctl restart corefreqd
复制代码





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3