计算化学公社
标题:
服务器跑不能同时跑多个任务问题
[打印本页]
作者Author:
jlyjlysjd
时间:
2024-7-3 18:07
标题:
服务器跑不能同时跑多个任务问题
服务器总的有4张卡,但是我提交多个任务上去,只有一个再跑,其他的会一直等待,请问这是什么原因呢?
sub.sh文件如下:
#!/bin/bash
#SBATCH -J gromacs
#SBATCH -N 1
#SBATCH -p gpu
#SBATCH --gres=gpu:1
#SBATCH --no-requeue
#SBATCH --ntasks-per-node=15
mpirun -np 1 gmx mdrun -ntomp 12 -ntmpi 1 -gpu_id 0 -deffnm eql
同时提交的时候我特意换了-gpu-id 1 还是在等待,很奇怪,是我哪里设置错了吗?
作者Author:
Dempey
时间:
2024-7-3 19:39
你可以scontrol show job <jobid>看一下作业的申请资源情况
作者Author:
jlyjlysjd
时间:
2024-7-5 19:52
Dempey 发表于 2024-7-3 19:39
你可以scontrol show job 看一下作业的申请资源情况
请问4块gpu上都在运行其他的程序但是都没有跑满,那有没有办法在sub.sh中调用非空GPU 运行作业呢
作者Author:
Dempey
时间:
2024-7-5 20:21
有办法,需要在slurm.conf和gres.conf加入shard或mps资源,具体可以看官网,如果只有gpu资源,那每张卡最多只能交一个任务
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3