计算化学公社

标题: 求助如何修改slurm脚本,交作业到某个特定服务器上 [打印本页]

作者
Author:
498746012    时间: 2021-3-26 11:26
标题: 求助如何修改slurm脚本,交作业到某个特定服务器上
各位老师打扰了,想问一下我想把某个任务提交到某一个指定节点上c020(hostname),不知道slurm脚本如何修改?如下是我的slurm脚本
#!/bin/bash
#
#SBATCH --nodes=1               # allocate 1 nodes for the job
#SBATCH --ntasks-per-node=36    # allocate 20 cores for the job
#SBATCH -o output.%J.out # the file to write stdout for job
#SBATCH -e output.%J.err # the file to write stderr for job
#SBATCH --job-name=a.gjf

input=a.gjf

jobname=$(echo "${input%.*}")

# start
export g09root=/share/apps/gaussian/g09D01
source $g09root/g09/bsd/g09.profile

#export g09root=/share/apps/gaussian/g16
#source $g09root/g16/bsd/g16.profile

scratch="/tmp/$USER/$SLURM_JOB_ID"

if [ ! -d $scratch ]; then
    mkdir -p $scratch
fi

export GAUSS_SCRDIR=$scratch

# run Gaussian 09
time g09 $input 2>&1 | tee $jobname.out

if [ -f $scratch/*.chk ]; then
    cp $scratch/*.chk $SLURM_SUBMIT_DIR
fi

rm -rf $scratch



作者
Author:
一颗赛艇    时间: 2021-3-26 12:33
#SBATCH -w <your_node>

自己多看看文档
作者
Author:
498746012    时间: 2021-3-26 14:20
一颗赛艇 发表于 2021-3-26 12:33
#SBATCH -w

自己多看看文档

谢谢老师
作者
Author:
乐平    时间: 2024-4-11 21:19
一颗赛艇 发表于 2021-3-26 12:33
#SBATCH -w

自己多看看文档

请问您这是在哪个手册里看到的?

我在官网上没找到 -w 这个选项

下面是 slurm 官网的 documents
https://slurm.schedmd.com/documentation.html

下面是 slurm 官网的简明指令合集
https://slurm.schedmd.com/pdfs/summary.pdf
作者
Author:
jackyjj123    时间: 2024-4-15 10:41
#SBATCH --nodelist=node1
作者
Author:
Santz    时间: 2024-4-15 11:29
本帖最后由 Santz 于 2024-4-15 20:32 编辑
乐平 发表于 2024-4-11 21:19
请问您这是在哪个手册里看到的?

我在官网上没找到 -w 这个选项

https://slurm.schedmd.com/sbatch.html
这里不是有嘛,-w或者--nodelist一样
-w, --nodelist=<node_name_list>
Request a specific list of hosts. The job will contain all of these hosts and possibly additional hosts as needed to satisfy resource requirements. The list may be specified as a comma-separated list of hosts, a range of hosts (host[1-5,7,...] for example), or a filename. The host list will be assumed to be a filename if it contains a "/" character. If you specify a minimum node or processor count larger than can be satisfied by the supplied host list, additional resources will be allocated on other nodes as needed. Duplicate node names in the list will be ignored. The order of the node names in the list is not important; the node names will be sorted by Slurm.


作者
Author:
乐平    时间: 2024-4-15 18:40
Santz 发表于 2024-4-15 11:29
https://slurm.schedmd.com/sbatch.html.
这里不是有嘛,-w或者--nodelist一样

抱歉,您的链接无效
  1. Not Found
  2. The requested URL was not found on this server.

  3. Apache/2.4.57 (Debian) Server at slurm.schedmd.com Port 443
复制代码



我在 CPU Management User and Administrator Guide 这一节看到了
https://slurm.schedmd.com/cpu_management.html


对应的链接应该是 https://slurm.schedmd.com/srun.html#OPT_nodelist


作者
Author:
Santz    时间: 2024-4-15 20:33
乐平 发表于 2024-4-15 18:40
抱歉,您的链接无效

这里https://slurm.schedmd.com/sbatch.html
作者
Author:
snljty2    时间: 2024-4-15 21:18
乐平 发表于 2024-4-15 18:40
抱歉,您的链接无效

其实
  1. sbatch --help
复制代码
就能查到~
作者
Author:
乐平    时间: 2024-4-16 01:25
snljty2 发表于 2024-4-15 21:18
其实就能查到~

谢谢,sbatch --help, 或者 sbatch -h 都可以查看

-w, --nodelist=hosts...     request a specific list of hosts

不过这样列出来的解释过于简略,还是官网 https://slurm.schedmd.com/srun.html#OPT_nodelist  里的解释更详细。

比如  list of hosts 可以写成  
host1,host2,host3,host4,host5,host7
逗号之间不要空格

也可以写成
host[1-5,7]

如果您指定的最小节点或处理器数量超过提供的主机列表可以满足的数量,额外资源将根据需要分配给其他节点。与其多次重复一个主机名,可以在主机名后附加星号和重复计数。
例如,“host1,host1” 和 “host1*2” 是等效的。





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3