一键批量提交Gaussian任务至slurm系统高性能计算集群 - 计算化学公社

#!/bin/bash
#SBATCH --ntasks-per-node=1
#SBATCH --job-name=Series-%j
#SBATCH --partition=cpu
#SBATCH --nodes=1
#SBATCH --cpus-per-task=1
#SBATCH --mem=4GB
#SBATCH --output=Series-%j.out
#SBATCH --error=Series-%j.err
# cpu节点、1核、4G内存（仅用于提交脚本，无需增大）
logfile="/根目录/Series-${SLURM_JOB_ID}.log"
# 将“根目录”替换为登陆时的默认目录
echo "Job name is Series, ID is ${SLURM_JOB_ID}." >> "$logfile"
echo "Started at $(date +"%F %A %T %:z")" >> "$logfile"
submitdate=$(date +"%Y%m%d-%H%M%S")
start_time=$(date +%s)
# 生成“提交任务”的 .log 文件，并记录提交过程耗时
for gjf_file in *.gjf; do # 遍历当前目录下的所有 .gjf 文件
job_name="${gjf_file%.gjf}" # 获取不带扩展名的文件名，即“高斯计算项目名称”
log_file="${job_name}.log" # 检查是否已存在 .log 文件
if [ ! -f "$log_file" ]; then # 如果不存在对应 .log 文件，则进行项目创建等后续操作
log_dir="/根目录" # 将“根目录”替换为登陆时的默认目录
mkdir -p "$log_dir"
dos2unix "${gjf_file}" # 将 .gjf 文件从 Windows 格式转换为 Linux 格式，请确保所用平台已安装该命令
cat > "$job_name.sh" << "EOF" # 创建.sh脚本，写入下列内容并执行
#!/bin/bash
#SBATCH --ntasks-per-node=1
#SBATCH --job-name=JOB_NAME_PLACEHOLDER
#SBATCH --partition=cpu
#SBATCH --nodes=1
#SBATCH --cpus-per-task=1
#SBATCH --mem=4GB
#SBATCH --output=JOB_NAME_PLACEHOLDER.out
#SBATCH --error=JOB_NAME_PLACEHOLDER.err
# cpu节点、1核、4G内存（用于执行高斯计算项目，根据任务修改）
# JOB_NAME_PLACEHOLDER 是一个占位符，后续会被修改为该项目的实际名称
r_d_logfile="/根目录/JOB_NAME_PLACEHOLDER.rlog"
# 创建一个 .rlog 文件，记录该项目的名字、 Linux 系统内 ID，起止时间、耗时，将“根目录”替换为登陆时的默认目录
echo "Job name is $SLURM_JOB_NAME, ID is ${SLURM_JOB_ID}." >> "$r_d_logfile"
echo "Started at $(date +"%F %A %T %:z")" >> "$r_d_logfile"
start_time=$(date +%s)
g16 JOB_NAME_PLACEHOLDER.gjf # 执行高斯计算
wait # 确保计算完成
formchk JOB_NAME_PLACEHOLDER.chk # 把 .chk 文件转换成 .fchk 文件
echo "Completed at $(date +"%F %A %T %:z")" >> "$r_d_logfile"
end_time=$(date +%s)
time_diff=$((end_time - start_time))
hours=$((time_diff / 3600))
minutes=$(((time_diff % 3600) / 60))
seconds=$((time_diff % 60))
echo "Total runtime: $(printf "%02d:%02d:%02d" $hours $minutes $seconds)" >> "$r_d_logfile"
# 计算耗时并写入 .rlog 文件
job_name="${SLURM_JOB_NAME}"
base_dir="/根目录" # 将“根目录”替换为登陆时的默认目录
target_dir="${base_dir}/${job_name}"
for file in ./*; do
[ -f "$file" ] || continue
file_base="${file##*/}"
file_prefix="${file_base%.*}"
if [ "$file_prefix" = "$job_name" ]; then
mkdir -p "$target_dir"
mv "$file" "$target_dir/"
fi # 在当前目录创建同名文件夹，把该项目相关的文件全部移动至其中
done
EOF
sed -i "s/JOB_NAME_PLACEHOLDER/$(printf "%q" "$job_name")/g" "$job_name.sh"
# 把占位符 JOB_NAME_PLACEHOLDER 换城正常的项目名称
sbatch "$job_name.sh" # 提交高斯计算项目
fi
done
echo "Completed at $(date +"%F %A %T %:z")" >> "$logfile"
# 在. log 文件中记录项目已全部提交
end_time=$(date +%s)
time_diff=$((end_time - start_time))
hours=$((time_diff / 3600))
minutes=$(((time_diff % 3600) / 60))
seconds=$((time_diff % 60))
echo "Total runtime: $(printf "%02d:%02d:%02d" $hours $minutes $seconds)" >> "$logfile"
# 在. log 文件中记录提交所有项目所需耗时
series_name="Series-${SLURM_JOB_ID}"
base_dir="/根目录/Series" # 将“根目录”替换为登陆时的默认目录
target_dir="${base_dir}/${series_name}-${submitdate}"
for file in ./*; do
[ -f "$file" ] || continue
file_base="${file##*/}"
file_prefix="${file_base%.*}"
if [ "$file_prefix" = "$series_name" ]; then
mkdir -p "$target_dir"
mv "$file" "$target_dir/"
fi
done
# 在当前目录创建 Series 文件夹，在其下创建 Series-slurmID-时间文件夹，把此次提交相关的文件全部移动至其中

复制代码