计算化学公社

 找回密码 Forget password
 注册 Register
Views: 7496|回复 Reply: 3
打印 Print 上一主题 Last thread 下一主题 Next thread

[任务提交/队列管理] torque计算节点pbs_mom 启动不了

[复制链接 Copy URL]

132

帖子

0

威望

1025

eV
积分
1157

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
Starting TORQUE Mom: pbs_mom: LOG_ERROR::No locks available (37) in pbs_mom, cannot lock '/opt/tsce/share/cu07/mom_priv/mom.lock' - another mom running
cannot lock '/opt/tsce/share/cu07/mom_priv/mom.lock' - another mom running
                                                           [FAILED]
================================================================
求助 之前集群都用的好好的,突然有一次断电重启之后,其中一个节点就出现这个情况了。这是什么原因呢?google查询过说什么和qnoded冲突。我把qnoded删掉之后重启计算节点,还是依然有这个问题。暂时我就没查到其他解决办法了。有没有谁知道的能给点建议啊?谢谢!

132

帖子

0

威望

1025

eV
积分
1157

Level 4 (黑子)

2#
 楼主 Author| 发表于 Post on 2016-1-22 16:43:58 | 只看该作者 Only view this author
后来发现把计算节点中某个同学算的gauss的tmp文件删除掉之后。。。。节点的pbs_mom就能启动了。。。还是不晓得原因是为什么

3

帖子

0

威望

68

eV
积分
71

Level 2 能力者

3#
发表于 Post on 2021-7-31 12:20:17 | 只看该作者 Only view this author
Thanks. I found it. nfslock was turned off on the master node. All the nodes were fine. Someone chkconfig'd nfslock off on the master.
https://torqueusers.supercluster ... s-problems-starting

打开服务就好了 systemctl start nfslock.service  

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
didi_dudu + 5 虽然已经2021年了,但还是感谢回答。

查看全部评分 View all ratings

1

帖子

0

威望

7

eV
积分
8

Level 1 能力者

4#
发表于 Post on 2023-11-17 17:38:17 | 只看该作者 Only view this author
今天遇到了同样的症状,baidu里第一个帖子就是这个,但没能解决我的问题。
后来我发现是计算节点硬盘满了,Gaussian在/tmp里留下一个巨大的文件,删掉就好了。
同时写了一个脚本,检查一下计算节点的磁盘空间,快满了删/tmp/*,添加到crontab每小时运行一次。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-27 11:39 , Processed in 0.219632 second(s), 28 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list