计算化学公社

 找回密码 Forget password
 注册 Register
Views: 899|回复 Reply: 9
打印 Print 上一主题 Last thread 下一主题 Next thread

[使用经验] 塔式机提交多个作业效率骤降,怎么办?

[复制链接 Copy URL]

108

帖子

0

威望

679

eV
积分
787

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
各位老师好,我按照下面的配置自购了一台塔式服务器:
[color=rgba(0, 0, 0, 0.65)]CPU:2 颗 Intel 8373C 正式版 36 核 72 线程 2.6-3.5GHz
[color=rgba(0, 0, 0, 0.65)]散热:4189 定制风扇
[color=rgba(0, 0, 0, 0.65)]主板:超微 X12-DPI-N6
[color=rgba(0, 0, 0, 0.65)]内存:三星原厂 REG ECC 256GB 2666MHz
[color=rgba(0, 0, 0, 0.65)]硬盘:三星 M.2 NVME 500GB 固态系统盘、希捷 4T ST4000NM000A 企业级存储盘
[color=rgba(0, 0, 0, 0.65)]电源:长城 1650W
[color=rgba(0, 0, 0, 0.65)]机箱:追风者 614pc
[color=rgba(0, 0, 0, 0.65)]

自己安装了slurm调度系统,按照http://bbs.keinsci.com/thread-32750-1-1.html配置。
经过计算测试发现两个问题:
1.核数跑满的效率并不是最好。比如Gaussian作业,经测试54核最快,再增加核数速度变慢。
2.不适合同时计算多个作业。比如同时提交2个作业会使每个作业的效率都降低一半。
请问是否有改进方法呢,谢谢!

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

2#
发表于 Post on 2023-8-11 11:18:09 | 只看该作者 Only view this author
一台机器当然不适合同时跑多个计算任务,这就是作业调度系统的作用,给任务排队,一个跑完再跑下一个。

9

帖子

0

威望

257

eV
积分
266

Level 3 能力者

3#
发表于 Post on 2023-8-11 11:20:55 | 只看该作者 Only view this author
1. 核数跑满当然效率不是很高,而且长期跑满会损伤CPU。另外大兄弟,36核的机器怎么测试出来54核效率最高。你的意思时54线程最快吗?我没做过相关测试,按理说线程越多运行速度越快,我的36核72线程的机器我算高斯都用70线程。
2. 同时多个作业算是超负荷运行,如果运行2个任务各35线程应该跟运行1个任务70线程是一样的。如果你的同时运行2个任务各70线程,这样超负荷运行效率当然会降低。

改进:对于算高斯来说,可以使用连续运行脚本,一个任务跑完接续着跑下一个任务。

另外我有一个问题:算高斯,计算速度除与运行线程数有关,跟内存设置有关系吗?

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

4#
发表于 Post on 2023-8-11 11:24:31 | 只看该作者 Only view this author
二十一 发表于 2023-8-11 11:20
1. 核数跑满当然效率不是很高,而且长期跑满会损伤CPU。另外大兄弟,36核的机器怎么测试出来54核效率最高。 ...

他是 2 颗 36核 CPU,所以总共的物理核心数是 2 x 36 = 72 核

125

帖子

0

威望

2268

eV
积分
2393

Level 5 (御坂)

5#
发表于 Post on 2023-8-11 12:00:06 | 只看该作者 Only view this author
我觉得速度变慢是机械硬盘导致的,我最近做freq,由于500G SSD空间不够,临时数据换在机械硬盘,结果用时多了不止一倍

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

6#
发表于 Post on 2023-8-11 12:51:12 | 只看该作者 Only view this author
那个配置仅仅是个演示,

要在生产环境使用, 缺少cgroup等资源管控限定.

缺少资源管控限定的调度系统, 基本是扯淡的玩意儿.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

5

帖子

0

威望

339

eV
积分
344

Level 3 能力者

7#
发表于 Post on 2023-8-11 14:32:17 | 只看该作者 Only view this author
二十一 发表于 2023-8-11 11:20
1. 核数跑满当然效率不是很高,而且长期跑满会损伤CPU。另外大兄弟,36核的机器怎么测试出来54核效率最高。 ...

长期跑满会损伤CPU这个结论是怎么来的啊,如果在散热强力不超过80度的前提下

27

帖子

0

威望

141

eV
积分
168

Level 3 能力者

8#
发表于 Post on 2023-8-11 15:40:45 | 只看该作者 Only view this author
看看io吞吐量吧,一般要组磁盘阵列

108

帖子

0

威望

679

eV
积分
787

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2023-8-12 07:48:26 | 只看该作者 Only view this author
看起来说法很多,我再测试看看,谢谢大家!

33

帖子

0

威望

704

eV
积分
737

Level 4 (黑子)

10#
发表于 Post on 2023-8-13 11:49:08 | 只看该作者 Only view this author
双路跨CPU的I/O效率远低于CPU内I/O,因此双路跑任务、应注意每个任务与独立一个CPU绑定;考虑到HT对计算任务可能不带来显著的优势,通常也应注意每个任务的进程数不应超过单路CPU的物理核心数,并尽量将每个进程绑定到一个物理核心上/或者关闭超线程,以避免两个进程同时调度至一个物理核心上;

同时跑多个任务是可行的,但是一定要注意负载分配。此外考虑到并行效率问题,对于良好绑定计算资源的情况,两个基本一致负载量的任务各16c同时运行,理论上运行效率会略高于两个任务分别先后用32c去跑;

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 08:32 , Processed in 0.168736 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list