计算化学公社

 找回密码 Forget password
 注册 Register
Views: 3857|回复 Reply: 3
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 队列调度 谁先算?

[复制链接 Copy URL]

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
默认采用FIFO,
first in, first out.

为了提升最大效率,也有兼顾利用率。

假设
可用资源总计100个核心。

假设用户按甲乙丙的先后顺序提交计算。

现在空闲10个核心。

用户甲 申请20个核心, walltime设定24小时。
用户乙 申请2个核心,walltime 1小时
用户丙 申请5个核心,walltime 2小时

系统查询到,队列中,最快能完成的作业并且能空出10个核心,还需要30小时。
那么,接下来的30小时内,
让乙或者丙优先运行计算,并不会影响甲。
所以,虽然是后续提交作业的乙或者丙,可能先计算。

甚至,就算是恰好空闲20个核心,
由于甲申请时长很长,
而乙和丙时间较短, 也有可能乙和丙的计算先运行。

实际中,队列调度可能更复杂一些,
比如用户优先权,用户组有限权等等。

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
 楼主 Author| 发表于 Post on 2021-4-14 14:43:15 | 只看该作者 Only view this author
再写几句。
调度流程,有时候可以类比为快递派送。

在派送deadline之前,
快递员可以优先派送物品轻巧,
派送耗时少,可以更快派送完的物品。

这样会显得,在某一个时间段内,
更快地派送出了更多的物品。

这就是,经常看到的,
后买的小件物品优先派送,
购买较早的大件物品,会稍晚派送。

调度系统,有时候为了保持高效率运作,
也会采取类似的策略。

要的核心数内存多,就是大件物品,
要的walltime长,就是要求派送的deadline更长久。
这是很好理解的事情。

当然现实中,会有高端会员,优先派送。
也就相当于队列中的VIP,具有较高的优先级。

对于小规模的集群系统,没有必要采用复杂的队列策略。
但是国家超算这种,
用户多,应用复杂的场景,
复杂的调度策略是必要的。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

125

帖子

0

威望

2298

eV
积分
2423

Level 5 (御坂)

3#
发表于 Post on 2021-4-14 15:34:37 | 只看该作者 Only view this author
我们这边的一般用户都喜欢申请walltime=999:00:00
有利有弊,这也为偷鸡摸狗偷偷排队的人提供了机会

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
 楼主 Author| 发表于 Post on 2021-4-14 16:27:29 | 只看该作者 Only view this author
doublezhang 发表于 2021-4-14 15:34
我们这边的一般用户都喜欢申请walltime=999:00:00
有利有弊,这也为偷鸡摸狗偷偷排队的人提供了机会

可以综合判定,
walltime很长, 但是连续一段时间,CPU负载, GPU负载很低,
就直接干掉该节点上的所有PBS session。

如果是slurm  要几个核心,去机器上,就只有几个核心, 祸害不了其他人。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:37 , Processed in 0.239318 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list