计算化学公社

 找回密码 Forget password
 注册 Register
Views: 8011|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[Gaussian/gview] 高斯通过pbs提交到集群问题

[复制链接 Copy URL]

67

帖子

0

威望

3380

eV
积分
3447

Level 5 (御坂)

本帖最后由 Jerryluo 于 2019-11-21 23:07 编辑


请问高斯提交到集群上出现上面的情况应该怎么处理。以下是提交的脚本


用户为test2,权限应该都没有问题:




67

帖子

0

威望

3380

eV
积分
3447

Level 5 (御坂)

9#
 楼主 Author| 发表于 Post on 2019-12-16 15:59:22 | 只看该作者 Only view this author
pwzhou 发表于 2019-11-25 14:10
最后这两行表示你们是用NIS管理用户的,
#update nis db
cd /var/yp && make

你好,打扰了,我在集群新增了一个队列,然后想重启一下pbs_server,先执行qterm -t quick,再执行pbs_server就报错了,请问有没有遇到过这样的问题,谢谢了。
[root@mgr wzluo]# pbs_server
Connecting to PBS dataservice...Failed to start PBS dataservice
..Failed to start PBS dataservice

之后,我尝试执行/etc/init.d/pbs restart,还是报错
[root@mgr wzluo]# /etc/init.d/pbs restart
Restarting PBS
Stopping PBS
PBS sched - was pid: 14490
PBS comm - was pid: 14392
Waiting for shutdown to complete
Starting PBS
PBS comm
/opt/pbs/sbin/pbs_comm ready (pid=34996), Proxy Name:mgr:17001, Threads:4
Creating usage database for fairshare.
PBS sched
Connecting to PBS dataservice...Failed to start PBS dataservice
..Failed to start PBS dataservice
.continuing in background.
PBS server

67

帖子

0

威望

3380

eV
积分
3447

Level 5 (御坂)

8#
 楼主 Author| 发表于 Post on 2019-12-16 15:56:58 | 只看该作者 Only view this author
Jerryluo 发表于 2019-11-25 14:59
刚才试了下,终于可以了,实在是太感谢了

你好,打扰了,我在集群新增了一个队列,然后想重启一下pbs_server,先执行qterm -t quick,再执行pbs_server就报错了,请问有没有遇到过这样的问题,谢谢了。
[root@mgr wzluo]# pbs_server
Connecting to PBS dataservice...Failed to start PBS dataservice
..Failed to start PBS dataservice

之后,我尝试执行/etc/init.d/pbs restart,还是报错
[root@mgr wzluo]# /etc/init.d/pbs restart
Restarting PBS
Stopping PBS
PBS sched - was pid: 14490
PBS comm - was pid: 14392
Waiting for shutdown to complete
Starting PBS
PBS comm
/opt/pbs/sbin/pbs_comm ready (pid=34996), Proxy Name:mgr:17001, Threads:4
Creating usage database for fairshare.
PBS sched
Connecting to PBS dataservice...Failed to start PBS dataservice
..Failed to start PBS dataservice
.continuing in background.
PBS server

67

帖子

0

威望

3380

eV
积分
3447

Level 5 (御坂)

7#
 楼主 Author| 发表于 Post on 2019-11-25 14:59:17 | 只看该作者 Only view this author
pwzhou 发表于 2019-11-25 14:10
最后这两行表示你们是用NIS管理用户的,
#update nis db
cd /var/yp && make

刚才试了下,终于可以了,实在是太感谢了

368

帖子

0

威望

4693

eV
积分
5061

Level 6 (一方通行)

6#
发表于 Post on 2019-11-25 14:10:06 | 只看该作者 Only view this author
Jerryluo 发表于 2019-11-25 12:04
集群不是rocks集群,是通用架构的,集群装的时候是供应商自己写的脚本。
我就是在计算节点用usermod命令 ...

最后这两行表示你们是用NIS管理用户的,
#update nis db
cd /var/yp && make
但是这个脚本并没有把用户添加到gaussian组,所以如果你在主节点把用户添加到gaussian组以后,还需要执行一下 cd /var/yp && make 这样才会用户的组信息同步到计算节点,所以解决办法就是在主节点再执行一下cd /var/yp && make 然后再检查一下,应该就可以了。

67

帖子

0

威望

3380

eV
积分
3447

Level 5 (御坂)

5#
 楼主 Author| 发表于 Post on 2019-11-25 12:04:18 | 只看该作者 Only view this author
本帖最后由 Jerryluo 于 2019-11-25 12:06 编辑
pwzhou 发表于 2019-11-25 08:30
不太了解你们集群的架构也不知道用户是怎么添加的,所以无法给出准确的回答。rocks集群的话,在主节点添 ...

集群不是rocks集群,是通用架构的,集群装的时候是供应商自己写的脚本。
我就是在
计算节点用usermod命令把test2用户添加到gaussian group的。


以下是添加用户的脚本:
#add user
#GROUP=users
BASE="/share/home"
HOME="${BASE}/${1}"
useradd -d $HOME $1
#init password
echo "111111" | passwd --stdin $1
#ssh
su -c "ssh-keygen -f ~/.ssh/id_rsa -t rsa -N ''" $1
su -c "cat ~/.ssh/id_rsa.pub >~/.ssh/authorized_keys " $1
su -c "echo 'StrictHostKeyChecking no'>~/.ssh/config" $1
#update nis db
cd /var/yp && make

368

帖子

0

威望

4693

eV
积分
5061

Level 6 (一方通行)

4#
发表于 Post on 2019-11-25 08:30:34 | 只看该作者 Only view this author
Jerryluo 发表于 2019-11-24 22:30
十分感谢您的解答。
这是计算节点的id
uid=1015(test2) gid=1019(test2) groups=1019(test2)

不太了解你们集群的架构也不知道用户是怎么添加的,所以无法给出准确的回答。rocks集群的话,在主节点添加完用户以后,直接执行rocks sync users,即可同步,这个命令的本质就是把主节点的/etc/passwd, /etc/shadow以及/etc/group拷贝到计算节点。如果用NIS管理用户的话,就需要在主节点cd /var/yp,然后执行一下make命令同步用户。但是你这个uid相同,gid不同,还真猜不出你们是怎么添加用户的,目前一个直接的解决办法就是在计算节点用usermod命令把test2用户添加到gaussian group即可。如果可以告诉你们集群的架构,即是通过什么来管理用户的,以及你们是怎么来添加test2这个用户的,应该可以给出最佳的解决办法。

67

帖子

0

威望

3380

eV
积分
3447

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2019-11-24 22:30:39 | 只看该作者 Only view this author
本帖最后由 Jerryluo 于 2019-11-24 22:31 编辑
pwzhou 发表于 2019-11-22 08:00
根据错误提示,就是权限问题,如果主节点没问题,那么去计算节点看看,看看两个节点的用户ID是否一致,gaus ...

十分感谢您的解答。
这是计算节点的id
uid=1015(test2) gid=1019(test2) groups=1019(test2)
这是管理节点的id
uid=1015(test2) gid=1005(gaussian) groups=1005(gaussian)
应该是用户信息没有同步,对集群方面不是很了解,集群用的是PBSPro调度软件,请问应该怎样同步呢,谢谢。

368

帖子

0

威望

4693

eV
积分
5061

Level 6 (一方通行)

2#
发表于 Post on 2019-11-22 08:00:51 | 只看该作者 Only view this author
本帖最后由 pwzhou 于 2019-11-22 08:02 编辑

根据错误提示,就是权限问题,如果主节点没问题,那么去计算节点看看,看看两个节点的用户ID是否一致,gaussian这个group的gid在两个节点是否一致?很可能时由于计算节点的用户信息没有同步导致的。rocks集群的话在添加新用户以后有没有通过rocks sync users同步新用户信息到计算节点?

还有一点,test2是不是在gaussian这个组里,目前只看到文件夹权限,这个不能确认test2在gaussian这个组里。

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-22 15:21 , Processed in 0.171624 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list