计算化学公社

 找回密码 Forget password
 注册 Register

集群上提交任务排队异常请问什么原因

查看数: 7623 | 评论数: 7 | 收藏 Add to favorites 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2017-10-10 21:42

正文摘要:

最近发现我的账号在集群上提交多个任务时只能运算第一个,从第二个开始就一直排队,即使当前集群上有很多空节点和足够多的内存,并且,第一个任务算完以后,第二个以及以后的那些在排队的仍然不会给算,还是在排队。 ...

回复 Reply

万卷书万里路 发表于 Post on 2017-10-17 09:05:58
kyuu 发表于 2017-10-16 23:04
影响排队时间的几个主要因子:节点数、CPU核数、wall time、GPU数量、内存,
你把任务的size缩小,一定 ...

好的,学到啦谢谢老师!
kyuu 发表于 Post on 2017-10-16 23:04:23
本帖最后由 kyuu 于 2017-10-16 23:12 编辑
万卷书万里路 发表于 2017-10-16 20:39
谢谢各位老师的回复!
我观察了这几天, 却又有的时候可以跑3、4个任务,有的时候只能跑一个,也不是账户属 ...

影响排队时间的几个主要因子:节点数、CPU核数、wall time、GPU数量、内存,
你把任务的size缩小,一定能快速排上队,如果只是为了测试任务脚本,1,用一到两个cpu,wall time别设几百个小时,几个小时即可, 2,使用互动模式, 3, 如果任务足够快,几分钟内可结束,登录节点直接算没问题(尽量使用2),一定要学会合理的预估计算资源规模,有利于减少排队时间
万卷书万里路 发表于 Post on 2017-10-16 20:39:29
谢谢各位老师的回复!
我观察了这几天, 却又有的时候可以跑3、4个任务,有的时候只能跑一个,也不是账户属性的设置,可能是kyuu老师说的“不一定看到的资源可用即可分配”
kyuu 发表于 Post on 2017-10-16 09:43:56
  系统里有一个queueing formula,管理员有实力可以改,另计划任务是有预见性的,需要在一定周期内达到资源可足够分配才能分配资源,这不意味着你所看到资源可用即可分配
abdoman 发表于 Post on 2017-10-11 08:59:33
是不是设置了你的帐户属性不对。比如每次只能有1个running job。
bluewhale 发表于 Post on 2017-10-11 08:28:07
安装了maui吗? Torque版本?
limaolin0 发表于 Post on 2017-10-10 22:23:24
是不是和定义的队列属性有关?每个人每个群组每个队列至多能提交的任务数被限制了。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-14 13:12 , Processed in 2.179867 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list