计算化学公社

标题: 服务器跑不能同时跑多个任务问题 [打印本页]

作者
Author:
jlyjlysjd    时间: 2024-7-3 18:07
标题: 服务器跑不能同时跑多个任务问题
服务器总的有4张卡,但是我提交多个任务上去,只有一个再跑,其他的会一直等待,请问这是什么原因呢?
sub.sh文件如下:
#!/bin/bash
#SBATCH -J gromacs
#SBATCH -N 1
#SBATCH -p gpu
#SBATCH --gres=gpu:1
#SBATCH --no-requeue
#SBATCH --ntasks-per-node=15
mpirun -np 1 gmx mdrun -ntomp 12 -ntmpi 1 -gpu_id 0 -deffnm eql


同时提交的时候我特意换了-gpu-id 1 还是在等待,很奇怪,是我哪里设置错了吗?

作者
Author:
Dempey    时间: 2024-7-3 19:39
你可以scontrol show job <jobid>看一下作业的申请资源情况


作者
Author:
jlyjlysjd    时间: 2024-7-5 19:52
Dempey 发表于 2024-7-3 19:39
你可以scontrol show job 看一下作业的申请资源情况

请问4块gpu上都在运行其他的程序但是都没有跑满,那有没有办法在sub.sh中调用非空GPU 运行作业呢
作者
Author:
Dempey    时间: 2024-7-5 20:21
有办法,需要在slurm.conf和gres.conf加入shard或mps资源,具体可以看官网,如果只有gpu资源,那每张卡最多只能交一个任务




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3