计算化学公社

 找回密码 Forget password
 注册 Register
Views: 925|回复 Reply: 13
打印 Print 上一主题 Last thread 下一主题 Next thread

[使用经验] 求助7K62满载降频到维持600MHZ

[复制链接 Copy URL]

220

帖子

0

威望

497

eV
积分
717

Level 4 (黑子)

       amd 7K62的单路服务器,运行g16满载跑任务,用htop发现满载频率掉到了600-900MHZ运行,满载温度95℃。
请问,这个是cpu温度太高导致降频了么?为什么降频到900MHZ这么低的频率,7K62默频是2600MHZ。
         请教一下老师是什么原因,是cpu有问题了么?目前用的水冷,但是没有开空调。
该如何处理为好?
谢谢!

1.png (75.72 KB, 下载次数 Times of downloads: 0)

1.png

2.png (647.22 KB, 下载次数 Times of downloads: 0)

2.png

3.png (215.77 KB, 下载次数 Times of downloads: 0)

3.png

220

帖子

0

威望

497

eV
积分
717

Level 4 (黑子)

14#
 楼主 Author| 发表于 Post on 2025-9-19 12:47:40 | 只看该作者 Only view this author
就是散热器不行了,换了新的的散热器(金钱豹的SP3 M97,200块一个,双风扇单塔散热器),现在满载全核心3.2GHZ,温度65-70摄氏度。

91

帖子

0

威望

486

eV
积分
577

Level 4 (黑子)

13#
发表于 Post on 2025-9-18 12:18:59 | 只看该作者 Only view this author
tonganlhy 发表于 2025-9-16 18:53
看一下温度监控,应该是散热原因。你电源是多少W的?

服务器2年前买的的,实在记不起电源的功率了,确实温度也高了,主要是现在80核心能够运行,虽然效率低一点,但是凑合用还是可以。

418

帖子

0

威望

772

eV
积分
1190

Level 4 (黑子)

12#
发表于 Post on 2025-9-16 18:53:43 | 只看该作者 Only view this author
sun35mr 发表于 2025-9-16 17:36
请问双路服务器7B12跑满128核心的时候时间久了会重启,但用80核心跑任务还挺稳定的,请问这种情况是散热原 ...

看一下温度监控,应该是散热原因。你电源是多少W的?

91

帖子

0

威望

486

eV
积分
577

Level 4 (黑子)

11#
发表于 Post on 2025-9-16 17:36:30 | 只看该作者 Only view this author
请问双路服务器7B12跑满128核心的时候时间久了会重启,但用80核心跑任务还挺稳定的,请问这种情况是散热原因还是电源的功率不够呢?

220

帖子

0

威望

497

eV
积分
717

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2025-9-8 15:29:47 | 只看该作者 Only view this author
wxyhgk 发表于 2025-9-8 14:53
直接买猫头鹰的散热器就行了,顶级

谢谢明白

246

帖子

7

威望

2020

eV
积分
2406

Level 5 (御坂)

9#
发表于 Post on 2025-9-8 14:53:36 | 只看该作者 Only view this author
yzh 发表于 2025-9-8 12:42
好的,谢谢指点,准备换金钱豹的双风扇散热器M97 SP3的,看看情况。

直接买猫头鹰的散热器就行了,顶级

220

帖子

0

威望

497

eV
积分
717

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2025-9-8 12:42:34 | 只看该作者 Only view this author
wxyhgk 发表于 2025-9-8 10:55
普通水冷(人民币 2k 以下的水冷)根本压不住 EPYC 的 CPU

好的,谢谢指点,准备换金钱豹的双风扇散热器M97 SP3的,看看情况。

246

帖子

7

威望

2020

eV
积分
2406

Level 5 (御坂)

7#
发表于 Post on 2025-9-8 10:55:17 | 只看该作者 Only view this author
普通水冷(人民币 2k 以下的水冷)根本压不住 EPYC 的 CPU

11

帖子

1

威望

469

eV
积分
500

Level 4 (黑子)

6#
发表于 Post on 2025-9-8 10:53:42 | 只看该作者 Only view this author
可以参考我写的一个帖子试试,主要原因可能是CPU供电温度超过100度降频的原因,http://bbs.keinsci.com/thread-55436-1-1.html

220

帖子

0

威望

497

eV
积分
717

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2025-9-8 09:45:42 | 只看该作者 Only view this author
David_R 发表于 2025-9-7 16:31
This looks like the CPU cooler is not installed or working correctly. Even if the ambient temperatur ...

thank you .water cooling has some problems.

220

帖子

0

威望

497

eV
积分
717

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2025-9-8 09:39:27 | 只看该作者 Only view this author
TretopL 发表于 2025-9-7 12:45
应该是过热降频了,不是cpu有质量问题,可以看下ipmi后台,大概率有报警的。解决方法可以是开空调或者不把c ...

谢谢,已经放空调房间了,房间温度设置的18℃,目前满载是85℃,应该是散热有问题,可能是水冷头不太行了,换个风冷试试。开机就45℃。

44

帖子

3

威望

550

eV
积分
654

Level 4 (黑子)

3#
发表于 Post on 2025-9-7 16:31:49 | 只看该作者 Only view this author
This looks like the CPU cooler is not installed or working correctly. Even if the ambient temperature is very high, you should not run into CPU temperatures quite this bad, especially if you're using water cooling. What's the cooler you're using? Which headers did you plug the pump/fans into? If you're using an AIO water cooler, make sure the pump is always running at full speeds. Since server motherboards aren't often expecting AIO cooling, I find it best to plug the pump directly into the PSU, since there is no need to adjust the pump speed anyway. Also, what temperatures are you seeing when the CPU is at idle?

16

帖子

0

威望

820

eV
积分
836

Level 4 (黑子)

2#
发表于 Post on 2025-9-7 12:45:25 | 只看该作者 Only view this author
应该是过热降频了,不是cpu有质量问题,可以看下ipmi后台,大概率有报警的。解决方法可以是开空调或者不把cpu跑满,我组的双路7k62也很容易降频报警,加起来96核心我一般只敢用90个

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-24 04:40 , Processed in 0.180864 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list