计算化学公社

标题: 求助:slurm 以srun指令提交gmx mdrun 不能索要多核心数计算 [打印本页]

作者
Author:
yuanen    时间: 2022-1-20 16:20
标题: 求助:slurm 以srun指令提交gmx mdrun 不能索要多核心数计算
本帖最后由 yuanen 于 2022-1-20 16:20 编辑

老师们好
我是用xshell和xftp软件登陆远程服务器在linux系统下提交运算我以srun -N 1 --cpus-per-task=24 -p batch -w node4 gmx mdrun -s nptr.tpr -deffnm nptr -ntmpi 4 -ntomp 6提交得到一个正常运行的任务


我想要提交第二个任务时同样以一下形式进行提交
srun -N 1 --cpus-per-task=8 -p batch -w node5 gmx mdrun -s nptr.tpr -deffnm nptr -ntmpi 1 -ntomp 8

但是却提示
srun: PrologSlurmctld failed, job killed
srun: Force Terminated job 155753
之后我以单核任务提交就可以


请问这是因为什么而导致不能提交多核心任务?谢谢

作者
Author:
abin    时间: 2022-1-21 10:30
为何要指定节点?

你所在的用户组, 有没有资源限定?

node5的硬件配置如何?
节点信息, 不是采用scontrol show  job ID看的,
这个指令, 只能看到分配给job ID对应的资源. 比如有48个CPU, 你给作业77542申请了8个CPU, 你就能看到8个CPU.

使用sinfo -lNe查看信息.
或者slurmd -C.
或者查看/etc/slurm/slurm.conf. 此文件可能在其他地方.

如果默认, 你就能使用一个队列,
那就可以简化为
surn -N 1 -n 8 gmx xxxxxxx 即可.
作者
Author:
yuanen    时间: 2022-1-22 17:31
abin 发表于 2022-1-21 10:30
为何要指定节点?

你所在的用户组, 有没有资源限定?

感谢老师,我对集群不是很了解,我去尝试一下,谢谢




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3