计算化学公社

标题: 请教,关于可能影响CentOS计算速度的一些细节问题 [打印本页]

作者
Author:
DoorBell    时间: 2020-10-27 07:21
标题: 请教,关于可能影响CentOS计算速度的一些细节问题
如题~

一是CPU电源模式,有powersave和performance两种,powersave会让不使用的处理器处于最低频率,而performance会让CPU尽量达到最高频率,请问有必要使用performance吗?另外发现在performance模式下由于不使用的核心频率仍然很高,似乎真正占用的核心频率反而因此有所下降?
二是swap空降,如果内存足够更多,完全关闭swap并且设置vm.swappiness=1是否会加快计算速度?

另外最近发现了一个奇怪现象,同一个postHF任务在完全相同的条件下几次启动计算,好像对应的速度会越来越慢?虽然慢得不多但是非常稳定的几乎每个分步都会变慢一些,这是正常现象吗?

非常感谢各位老师!



作者
Author:
sobereva    时间: 2020-10-27 07:31
1 没必要改它,默认即可,不会因为默认设置有碍性能
2 实际计算的时候要求分配的内存量不超过空余物理内存量就行了,这个也没必要特意改它

不是正常现象。我不知道“几次启动”具体怎么做的,是上个任务正常跑完了还是强制中断的,以及用的是什么程序。如果是强制中断的,看看是否有相关进程还没彻底杀死之类
作者
Author:
DoorBell    时间: 2020-10-27 07:38
sobereva 发表于 2020-10-27 07:31
1 没必要改它,默认即可,不会因为默认设置有碍性能
2 实际计算的时候要求分配的内存量不超过空余物理内存 ...

好的,蟹蟹sob老师!

主要是发现即使剩余仍有物理内存,系统仍然会使用swap空间,不过好像确实没有多大影响,只是不知道在内存完全充裕的情况下关闭swap是否会加速计算?

任务是强制杀死的,检查过没有残留进程,然后再次在同样的环境和设置下启动,计算的一些步骤就变慢了,很奇怪QAQ
作者
Author:
DoorBell    时间: 2020-10-27 14:25
sobereva 发表于 2020-10-27 07:31
1 没必要改它,默认即可,不会因为默认设置有碍性能
2 实际计算的时候要求分配的内存量不超过空余物理内存 ...

经检查,发现/sys/devices/system/edac/mc/mc0/csrow0/ch2_ce_count该值不为零,且系统日志中可以看到HANDLING MCE MEMORY ERROR这样的错误。并且在调换主板上两条内存的位置之后发现报错的内存的位置也发生变化,请问这样可以确定是内存条存在故障吗?
作者
Author:
sobereva    时间: 2020-10-29 13:09
DoorBell 发表于 2020-10-27 14:25
经检查,发现/sys/devices/system/edac/mc/mc0/csrow0/ch2_ce_count该值不为零,且系统日志中可以看到HAN ...

就留一条你觉得没问题的内存,看看还有没有类似的变慢的现象。按说内存有问题的概率应该很小
作者
Author:
DoorBell    时间: 2020-11-5 06:40
sobereva 发表于 2020-10-29 13:09
就留一条你觉得没问题的内存,看看还有没有类似的变慢的现象。按说内存有问题的概率应该很小

内存已更换完成,经检测之前的报错问题已消除,但是计算变慢的问题还是存在,确实是很奇怪的。

也许是因为消费级固态硬盘在高负载读写之后性能损耗?
作者
Author:
sobereva    时间: 2020-11-5 21:56
DoorBell 发表于 2020-11-5 06:40
内存已更换完成,经检测之前的报错问题已消除,但是计算变慢的问题还是存在,确实是很奇怪的。

也许是 ...

一般的DFT计算是不怎么读写硬盘的,如果这类计算也是这个问题,和硬盘不会有什么关系
作者
Author:
Jasminer    时间: 2020-11-5 22:03
机箱内变热所以cpu平均频率下降了吧?
作者
Author:
niobium    时间: 2020-11-5 22:04
系统什么版本?据南大超算中心的老师测试,centos 7.6系统内核有bug,使用时间长了后性能会下降,7.8没有这个问题
作者
Author:
DoorBell    时间: 2020-11-6 01:01
本帖最后由 DoorBell 于 2020-11-6 01:04 编辑
sobereva 发表于 2020-11-5 21:56
一般的DFT计算是不怎么读写硬盘的,如果这类计算也是这个问题,和硬盘不会有什么关系

DFT计算时间复现性还不错,但是CCSD(T)持续变慢QAQ

实在找不出问题在哪了,能想到的东西基本都试了,但是好像每次都是越弄越糟糕,内核都重新编译过也没啥变化...不知道是不是消费级固态硬盘随着TBW增加性能会不可逆下降?

另外的一个可能就是系统中断(怀疑是网卡,因为发现pip和yum都比较慢,即使换源了)导致的,但是这东西涉及太多内核的东西,搞不懂太难顶了。

另外CentOS好像在常见发行版中速度和性能上并不占优势主要是稳定?

作者
Author:
DoorBell    时间: 2020-11-6 01:04
niobium 发表于 2020-11-5 22:04
系统什么版本?据南大超算中心的老师测试,centos 7.6系统内核有bug,使用时间长了后性能会下降,7.8没有这 ...
  1. [root@smp ~]# cat /etc/redhat-release
  2. CentOS Linux release 7.8.2003 (Core)
复制代码

作者
Author:
DoorBell    时间: 2020-11-6 01:06
Jasminer 发表于 2020-11-5 22:03
机箱内变热所以cpu平均频率下降了吧?

CPU温度稳定55以下,不会降频吧

另外这个对比也不是两次连续计算对比,计算终止隔一段时间之后再重启计算一样变慢
作者
Author:
DoorBell    时间: 2020-11-7 14:24
sobereva 发表于 2020-11-5 21:56
一般的DFT计算是不怎么读写硬盘的,如果这类计算也是这个问题,和硬盘不会有什么关系

另外就是powersave的电源模式会使得系统把中断全部放到CPU0上以尽量空闲其他CPU,理论上这样会使得性能不如performance的均摊中断到所有CPU上吧
作者
Author:
sobereva    时间: 2020-11-8 19:17
DoorBell 发表于 2020-11-7 14:24
另外就是powersave的电源模式会使得系统把中断全部放到CPU0上以尽量空闲其他CPU,理论上这样会使得性能不 ...

没测试过。应该不会有什么影响

你那么怀疑硬盘的话,就把scratch目录放到别的硬盘上再试。或者用其它计算程序做CCSD(T)看有无类似现象





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3