计算化学公社
标题:
Torque在意外断电之后无法自动运行队列中的任务
[打印本页]
作者Author:
Accelerator
时间:
2017-9-10 22:45
标题:
Torque在意外断电之后无法自动运行队列中的任务
我在自己的机器(Ubuntu系统)上安装了单节点Torque,并成功实现了排队功能,提交任务后不需人为干预就能自动分配资源执行任务。但一次意外断电(此时队列中尚有未完成的任务),重启后发现只能用qrun强制执行才能让队列中的任务开始运行了。后续新提交的任务也无法自动运行。尝试重启Torque相关服务无效。求解决方法。
作者Author:
milkxx
时间:
2017-9-28 16:15
检查pbs_sched 进程是否启动
作者Author:
Accelerator
时间:
2017-10-8 20:08
根据ls的方法解决了这一问题。但是服务器重启之后就有了新的问题,节点信息好像丢失了一样,显示节点数为0.我把Torque卸掉重装了一次,并按照
http://www.mamicode.com/info-detail-874473.html
的方法配置,但是在qmgr一步遇到了图中的报错。
(, 下载次数 Times of downloads: 40)
上传 Uploaded
点击下载Click to download
请问这要如何解决?
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3