计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2893|回复 Reply: 21
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 求助:slurm的一个节点如何运行多个作业

[复制链接 Copy URL]

33

帖子

0

威望

1250

eV
积分
1283

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
在一台64核的服务器安装了slurm队列软件,一个作业设置为16核,但是只能运行一个作业,不能运行4个作业。请问该如何设置一下

6

帖子

0

威望

89

eV
积分
95

Level 2 能力者

22#
发表于 Post on 2024-7-27 06:27:49 | 只看该作者 Only view this author
kail 发表于 2024-4-12 17:28
我也遇到这个问题,看了这个帖子,添加 SelectTypeParameters=CR_CPU 后,发现计算速度变慢了。查了官方文 ...

您好,请问这里的每个CPU是指的核心数吗?我是双路两个CPU,每个48核心,开了超线程,请问这个数字用2还是96还是192啊?

100

帖子

0

威望

1276

eV
积分
1376

Level 4 (黑子)

21#
发表于 Post on 2024-5-23 14:00:36 | 只看该作者 Only view this author
lilf 发表于 2024-2-25 16:25
已经解决了,更改这里就行了
SelectType=select/cons_tres
SelectTypeParameters=CR_CPU

更改了之后还是没用,奇怪

1

帖子

0

威望

49

eV
积分
50

Level 2 能力者

20#
发表于 Post on 2024-4-12 17:28:02 | 只看该作者 Only view this author
我也遇到这个问题,看了这个帖子,添加 SelectTypeParameters=CR_CPU 后,发现计算速度变慢了。查了官方文档,原来 SelectType=select/cons_tres 默认的配置是CR_Core_Memory,在该选项下,需要配置每个CPU可以使用的内存,添加 DefMemPerCPU=xxxx 之后,就可以运行多个任务了,速度也没有减慢。

92

帖子

1

威望

815

eV
积分
927

Level 4 (黑子)

19#
发表于 Post on 2024-3-25 16:44:15 | 只看该作者 Only view this author
可以根据你编译软件用的不同的编译器设置语言绑定到具体的CPU上,可以实现高效并行。举个简单的例子,比如intelmpi可以用 -genv I_MPI_PIN_PROCESSOR_LIST 0-31 ,实现绑定。openmpi可以参考社长写的提升orca并行效率的帖子。http://sobereva.com/553  

33

帖子

0

威望

1250

eV
积分
1283

Level 4 (黑子)

18#
 楼主 Author| 发表于 Post on 2024-2-29 10:16:30 | 只看该作者 Only view this author
Kamistry 发表于 2024-2-28 22:20
这个网站就是官方的配置生成

谢谢

35

帖子

3

威望

794

eV
积分
889

Level 4 (黑子)

17#
发表于 Post on 2024-2-28 22:20:20 | 只看该作者 Only view this author
lilf 发表于 2024-2-27 17:02
您能发我一个配置文件吗,我再试试看

这个网站就是官方的配置生成

33

帖子

0

威望

1250

eV
积分
1283

Level 4 (黑子)

16#
 楼主 Author| 发表于 Post on 2024-2-27 17:02:41 | 只看该作者 Only view this author
Kamistry 发表于 2024-2-27 09:46
看看https://slurm.schedmd.com/configurator.easy.html,官网给出的设置一样没有这行。而且我们的双路96 ...

您能发我一个配置文件吗,我再试试看

35

帖子

3

威望

794

eV
积分
889

Level 4 (黑子)

15#
发表于 Post on 2024-2-27 09:46:51 | 只看该作者 Only view this author
本帖最后由 Kamistry 于 2024-2-27 09:50 编辑
lilf 发表于 2024-2-26 14:24
我把SelectTypeParameters=CR_CPU删掉后,又不可以算多个任务了,应该这个是必须的

看看https://slurm.schedmd.com/configurator.easy.html,官网给出的设置一样没有这行。而且我们的双路9654没有加这行,完全可以多个任务一起跑。

刚才找了一台2620v4,核数少的情况一样不需要这一行就能跑多个任务。

33

帖子

0

威望

1250

eV
积分
1283

Level 4 (黑子)

14#
 楼主 Author| 发表于 Post on 2024-2-26 17:02:05 | 只看该作者 Only view this author
九月九 发表于 2024-2-26 14:58
分成4个作业提交可能会严重每个作业的计算效率

机器的核数有64个

108

帖子

0

威望

679

eV
积分
787

Level 4 (黑子)

13#
发表于 Post on 2024-2-26 14:58:29 | 只看该作者 Only view this author
lilf 发表于 2024-2-26 14:24
我把SelectTypeParameters=CR_CPU删掉后,又不可以算多个任务了,应该这个是必须的

分成4个作业提交可能会严重每个作业的计算效率

33

帖子

0

威望

1250

eV
积分
1283

Level 4 (黑子)

12#
 楼主 Author| 发表于 Post on 2024-2-26 14:24:13 | 只看该作者 Only view this author
Kamistry 发表于 2024-2-25 20:19
后面这行不是必须的,不如默认的CR_Core,如果要改也应该改成CR_Core_Memory同时分配内存。参见https://s ...

我把SelectTypeParameters=CR_CPU删掉后,又不可以算多个任务了,应该这个是必须的

35

帖子

3

威望

794

eV
积分
889

Level 4 (黑子)

11#
发表于 Post on 2024-2-25 20:19:14 | 只看该作者 Only view this author
本帖最后由 Kamistry 于 2024-2-25 20:22 编辑
lilf 发表于 2024-2-25 16:24
已经解决了,改了
SelectType=select/cons_tres
SelectTypeParameters=CR_CPU

后面这行不是必须的,不如默认的CR_Core,如果要改也应该改成CR_Core_Memory同时分配内存。参见https://slurm.schedmd.com/cons_tres.html。说明我之前说解决方法的时候你没有试

33

帖子

0

威望

1250

eV
积分
1283

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2024-2-25 16:25:15 | 只看该作者 Only view this author
lilf 发表于 2024-2-23 16:47
更改了之后,也不管用

已经解决了,更改这里就行了
SelectType=select/cons_tres
SelectTypeParameters=CR_CPU

33

帖子

0

威望

1250

eV
积分
1283

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2024-2-25 16:24:27 | 只看该作者 Only view this author
Kamistry 发表于 2024-2-23 18:53
更改之后重启slurmctld和slurmd了吗

已经解决了,改了
SelectType=select/cons_tres
SelectTypeParameters=CR_CPU

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:44 , Processed in 0.195897 second(s), 28 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list