计算化学公社

 找回密码 Forget password
 注册 Register
Views: 9600|回复 Reply: 21
打印 Print 上一主题 Last thread 下一主题 Next thread

[Linux] slurm作业系统只能同时运行一个任务

[复制链接 Copy URL]

300

帖子

0

威望

4190

eV
积分
4490

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
自己在单个节点安装的slurm,仅能同时运行一个任务,多了就PD。slurm.conf如下:
SlurmctldPort=6817
SlurmdPort=6818
AuthType=auth/munge
StateSaveLocation=/tmp
SlurmdSpoolDir=/tmp/slurmd
SwitchType=switch/none
MpiDefault=none
SlurmctldPidFile=/var/run/slurm-llnl/slurmctld.pid
SlurmdPidFile=/var/run/slurm-llnl/slurmd.pid
ProctrackType=proctrack/pgid
CacheGroups=0
ReturnToService=2
TaskPlugin=task/affinity

# make the default memory per core
DefMemPerNode=1024
MaxJobCount=10
MinJobAge=180


# TIMERS
SlurmctldTimeout=120
SlurmdTimeout=120
InactiveLimit=0
KillWait=30
Waittime=0


# SCHEDULING
SchedulerType=sched/backfill

#SchedulerPort=7321
SelectType=select/cons_res
SelectTypeParameters=CR_CPU_Memory
FastSchedule=0

# LOGGING
SlurmctldDebug=3

#SlurmctldLogFile=/var/log/slurmctld.log
SlurmdDebug=3

#SlurmdLogFile=/var/log/slurmd.log
JobCompType=jobcomp/none

#JobCompLoc=
JobAcctGatherType=jobacct_gather/none

# COMPUTE NODES
#NodeName=P920-2
#PartitionName=DEFAULT MaxTime=INFINITE State=UP
# NODES

NodeName=xxxx CPUs=24 RealMemory=6404
PartitionName=compute #Nodes=ALL Default=YES Shared=YES


14

帖子

0

威望

345

eV
积分
359

Level 3 能力者

22#
发表于 Post on 2023-2-5 22:24:10 | 只看该作者 Only view this author
sun35mr 发表于 2023-1-11 13:12
SelectTypeParameters=CR_Core
这里这么改就行了

好的,谢谢,已解决。

14

帖子

0

威望

345

eV
积分
359

Level 3 能力者

21#
发表于 Post on 2023-2-5 22:23:54 | 只看该作者 Only view this author
archer 发表于 2023-1-9 17:29
时间太久,我也忘了,试试前面的方法

好的,谢谢,已解决。

38

帖子

0

威望

1918

eV
积分
1957

Level 5 (御坂)

20#
发表于 Post on 2023-1-16 19:45:53 | 只看该作者 Only view this author
sun35mr 发表于 2023-1-11 13:12
SelectTypeParameters=CR_Core
这里这么改就行了

非常感谢

85

帖子

0

威望

394

eV
积分
479

Level 3 能力者

19#
发表于 Post on 2023-1-11 13:12:47 | 只看该作者 Only view this author
zblxyrz 发表于 2023-1-5 23:48
请问是怎么解决的?

SelectTypeParameters=CR_Core
这里这么改就行了

300

帖子

0

威望

4190

eV
积分
4490

Level 6 (一方通行)

18#
 楼主 Author| 发表于 Post on 2023-1-9 17:29:16 | 只看该作者 Only view this author
zblxyrz 发表于 2023-1-5 23:48
请问是怎么解决的?

时间太久,我也忘了,试试前面的方法

300

帖子

0

威望

4190

eV
积分
4490

Level 6 (一方通行)

17#
 楼主 Author| 发表于 Post on 2023-1-9 17:28:05 | 只看该作者 Only view this author
mxh 发表于 2022-11-16 20:44
slurm作业系统只能同时运行一个任务,请问老师,您是如何解决的,请老师赐教

时间太久,我也忘了,试试前面的方法

300

帖子

0

威望

4190

eV
积分
4490

Level 6 (一方通行)

16#
 楼主 Author| 发表于 Post on 2023-1-9 17:27:42 | 只看该作者 Only view this author
好孩纸呀 发表于 2021-3-28 19:41
您好  您是怎么解决的啊

时间太久,我也忘了,试试前面的方法

38

帖子

0

威望

1918

eV
积分
1957

Level 5 (御坂)

15#
发表于 Post on 2023-1-5 23:48:02 | 只看该作者 Only view this author
请问是怎么解决的?

14

帖子

0

威望

345

eV
积分
359

Level 3 能力者

14#
发表于 Post on 2022-11-16 20:44:16 | 只看该作者 Only view this author
archer 发表于 2020-12-15 12:10
已解决,请问您知道多台如何配置slurm吗

slurm作业系统只能同时运行一个任务,请问老师,您是如何解决的,请老师赐教

13

帖子

0

威望

139

eV
积分
152

Level 3 能力者

13#
发表于 Post on 2021-3-28 19:41:32 | 只看该作者 Only view this author
archer 发表于 2020-12-15 12:10
已解决,请问您知道多台如何配置slurm吗

您好  您是怎么解决的啊

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

12#
发表于 Post on 2020-12-15 14:52:31 | 只看该作者 Only view this author
archer 发表于 2020-12-15 12:10
已解决,请问您知道多台如何配置slurm吗

我的机器就是多节点slurm调度集群。

我自己做的。

如果你想知道怎么做,可以看slurm手册。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

14

帖子

0

威望

1004

eV
积分
1018

Level 4 (黑子)

11#
发表于 Post on 2020-12-15 14:35:46 | 只看该作者 Only view this author
可能和提交的任务申请了超过单个节点一半的内存有关,试试在提交的脚本里添加一下最大占用内存的设置,如参数#SBATCH --mem-per-cpu=1000 #MB;

300

帖子

0

威望

4190

eV
积分
4490

Level 6 (一方通行)

10#
 楼主 Author| 发表于 Post on 2020-12-15 12:10:32 | 只看该作者 Only view this author
abin 发表于 2020-12-1 11:07
盲猜,应该是Ubuntu系统。

不过我的可以用呀,(因为我的也是Ubuntu系统呀) 我仅仅是测试了一下:

已解决,请问您知道多台如何配置slurm吗

31

帖子

0

威望

72

eV
积分
103

Level 2 能力者

9#
发表于 Post on 2020-12-1 12:35:41 | 只看该作者 Only view this author
配置文件问题,与linux发行版本无关,善用软件日志
解决办法:
1)删除SelectTypeParameters=CR_CPU_Memory里面的_Memory;其实不带Memory的参数都可以;
2)如SelectTypeParameters=CR_CPU_Memory不改动,则需定义内存使用参数;

评分 Rate

参与人数
Participants 2
eV +10 收起 理由
Reason
hit_liaols + 5 赞!
archer + 5 谢谢

查看全部评分 View all ratings

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:27 , Processed in 0.417575 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list