计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2376|回复 Reply: 2
打印 Print 上一主题 Last thread 下一主题 Next thread

[任务提交/队列管理] 求助:slurm 以srun指令提交gmx mdrun 不能索要多核心数计算

[复制链接 Copy URL]

19

帖子

0

威望

722

eV
积分
741

Level 4 (黑子)

本帖最后由 yuanen 于 2022-1-20 16:20 编辑

老师们好
我是用xshell和xftp软件登陆远程服务器在linux系统下提交运算我以srun -N 1 --cpus-per-task=24 -p batch -w node4 gmx mdrun -s nptr.tpr -deffnm nptr -ntmpi 4 -ntomp 6提交得到一个正常运行的任务


我想要提交第二个任务时同样以一下形式进行提交
srun -N 1 --cpus-per-task=8 -p batch -w node5 gmx mdrun -s nptr.tpr -deffnm nptr -ntmpi 1 -ntomp 8

但是却提示
srun: PrologSlurmctld failed, job killed
srun: Force Terminated job 155753
之后我以单核任务提交就可以


请问这是因为什么而导致不能提交多核心任务?谢谢

正常.gif (27.13 KB, 下载次数 Times of downloads: 17)

正常一个24核任务在跑

正常一个24核任务在跑

202201201610348644..png (12.93 KB, 下载次数 Times of downloads: 17)

202201201610348644..png

任务出错1.gif (54.08 KB, 下载次数 Times of downloads: 18)

出错1

出错1

取消.gif (27.05 KB, 下载次数 Times of downloads: 18)

出错任务的节点描述

出错任务的节点描述

单核任务.gif (34.78 KB, 下载次数 Times of downloads: 17)

单核任务

单核任务

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
发表于 Post on 2022-1-21 10:30:09 | 只看该作者 Only view this author
为何要指定节点?

你所在的用户组, 有没有资源限定?

node5的硬件配置如何?
节点信息, 不是采用scontrol show  job ID看的,
这个指令, 只能看到分配给job ID对应的资源. 比如有48个CPU, 你给作业77542申请了8个CPU, 你就能看到8个CPU.

使用sinfo -lNe查看信息.
或者slurmd -C.
或者查看/etc/slurm/slurm.conf. 此文件可能在其他地方.

如果默认, 你就能使用一个队列,
那就可以简化为
surn -N 1 -n 8 gmx xxxxxxx 即可.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

19

帖子

0

威望

722

eV
积分
741

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2022-1-22 17:31:38 | 只看该作者 Only view this author
abin 发表于 2022-1-21 10:30
为何要指定节点?

你所在的用户组, 有没有资源限定?

感谢老师,我对集群不是很了解,我去尝试一下,谢谢

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 17:22 , Processed in 0.189594 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list