计算化学公社

标题: Torque在意外断电之后无法自动运行队列中的任务 [打印本页]

作者
Author:
Accelerator    时间: 2017-9-10 22:45
标题: Torque在意外断电之后无法自动运行队列中的任务
我在自己的机器(Ubuntu系统)上安装了单节点Torque,并成功实现了排队功能,提交任务后不需人为干预就能自动分配资源执行任务。但一次意外断电(此时队列中尚有未完成的任务),重启后发现只能用qrun强制执行才能让队列中的任务开始运行了。后续新提交的任务也无法自动运行。尝试重启Torque相关服务无效。求解决方法。

作者
Author:
milkxx    时间: 2017-9-28 16:15
检查pbs_sched 进程是否启动
作者
Author:
Accelerator    时间: 2017-10-8 20:08
根据ls的方法解决了这一问题。但是服务器重启之后就有了新的问题,节点信息好像丢失了一样,显示节点数为0.我把Torque卸掉重装了一次,并按照http://www.mamicode.com/info-detail-874473.html的方法配置,但是在qmgr一步遇到了图中的报错。 (, 下载次数 Times of downloads: 40) 请问这要如何解决?




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3