计算化学公社

 找回密码 Forget password
 注册 Register
Views: 368|回复 Reply: 5
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 求助:组内超算平台新建用户无法通过pbs正常提交任务

[复制链接 Copy URL]

2

帖子

0

威望

136

eV
积分
138

Level 2 能力者

在组内的超算上给师弟开了新的账号,但是新账号无法正常提交高斯和lammps任务,提交之后状态为R(有时候会跳到Q),但机时一直为0,也没有结果文件生成。

用老帐号都能正常提交任务,环境变量的配置新老账号都一致,qmgr权限设置也都一样,请问一下为什么新账号都无法正常提交任务呀


2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
发表于 Post on 2024-8-26 19:55:41 | 只看该作者 Only view this author
用户系统,或者用户信息系统用啥做的?

PBS,只管队列,不管用户鉴权。

早期的集群,可能会采用NIS.

后来,可能用LDAP.

或者可能有其他方案……
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2

帖子

0

威望

136

eV
积分
138

Level 2 能力者

3#
 楼主 Author| 发表于 Post on 2024-8-27 09:52:36 | 只看该作者 Only view this author
abin 发表于 2024-8-26 19:55
用户系统,或者用户信息系统用啥做的?

PBS,只管队列,不管用户鉴权。

感谢您的回复!我们组的超算用的应该是NIS,经过排查我发现在子节点上新建用户文件夹的所有组都是nobody,可能是这个原因导致新用户提交的任务无法同步到计算节点下。

随后我想直接更改用户文件夹的权限,发现新用户不在子节点的系统中(但是有用户文件夹)。

请问我现在是需要修改NIS的配置来解决这个问题么

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
发表于 Post on 2024-8-27 10:14:00 | 只看该作者 Only view this author
zth 发表于 2024-8-27 09:52
感谢您的回复!我们组的超算用的应该是NIS,经过排查我发现在子节点上新建用户文件夹的所有组都是nobody ...

你都说了是NIS控制,
那就查手册,看配置备忘录,看看这套系统上,NIS如何操控呀!
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

83

帖子

2

威望

3013

eV
积分
3136

Level 5 (御坂)

5#
发表于 Post on 2024-8-27 10:57:32 | 只看该作者 Only view this author
zth 发表于 2024-8-27 09:52
感谢您的回复!我们组的超算用的应该是NIS,经过排查我发现在子节点上新建用户文件夹的所有组都是nobody ...

用户家目录存在,而用户本身在计算节点上不存在,说明文件同步了,用户没有同步到计算点。看 NIS 的配置,一般在 NIS SERVER 上make -C /var/yp 就行,先确认管理节点上这个用户正常添加了。

11

帖子

0

威望

49

eV
积分
60

Level 2 能力者

6#
发表于 Post on 2024-8-27 22:06:35 | 只看该作者 Only view this author
账户没有同步,集群不大的话,直接把passwd groups shadow复制到计算节点就可以了。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 08:32 , Processed in 0.181514 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list