计算化学公社

 找回密码 Forget password
 注册 Register
Views: 857|回复 Reply: 4
打印 Print 上一主题 Last thread 下一主题 Next thread

[Linux] 求助:Slurm任务中的CPU管理

[复制链接 Copy URL]

197

帖子

1

威望

1104

eV
积分
1321

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
请问一下各位老师,我在自己的工作站上安装了slurm队列系统(48核,96线程),但是在运行的时候发现一个问题:假设我提交了10个vasp任务,每个任务的提交脚本如下:
  1. #!/bin/bash

  2. #SBATCH --job-name vasp
  3. #SBATCH -p localhost.localdomain
  4. #SBATCH -o vasp.out
  5. #SBATCH -N 1
  6. #SBATCH --ntasks-per-node=24


  7. source /opt/intel/oneapi/setvars.sh intel64
  8. export PATH=$PATH:/run/media/polyucmp/282ab895-d12b-4248-8357-261397bf73a6/software/vasp.6.4.2/bin/

  9. ulimit -s unlimited
  10. ulimit -c unlimited
  11. export OMP_NUM_THREADS=1

  12. mpirun -np 24 vasp_std


复制代码

1.我之前在slurm.conf设置了SelectType=SELECT/LINEAR,这样的话我的电脑上每次只能运行一个24核的任务
2.之后我改成了
SelectType=SELECT/CONS_RES,SelectParameters=CR_Core。这样的话能同时运行4个任务,但是每个任务的时间被大大延长了。猜测是超线程的原因?(96个线程每个任务24线程,互相影响)
想请问一下各位slurm.conf里应该怎么改才能让48核的机器每次最多只能运行两个24核的任务呢,这样也不会有线程之间的互相影响,能大大提升速度。求指点!


2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

2#
发表于 Post on 2023-9-14 12:49:59 | 只看该作者 Only view this author
本帖最后由 abin 于 2023-9-14 14:30 编辑

先关闭, 关闭超线程……


或者, 合理使用 srun -c -N -n等参数. 涉及openMP+MPI混合并行.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

353

帖子

1

威望

1971

eV
积分
2344

Level 5 (御坂)

3#
发表于 Post on 2023-9-14 16:01:11 | 只看该作者 Only view this author
一个不太优雅的方法,--ntasks-per-node=48就完了。另外可能还得设置一下线程绑定之类的。

403

帖子

4

威望

2874

eV
积分
3357

Level 5 (御坂)

4#
发表于 Post on 2023-9-14 16:59:43 | 只看该作者 Only view this author
在/etc/slurm/slurm.conf中有关于核数的配置,类似这样:
  1. # COMPUTE NODES
  2. NodeName=FakeNode
  3. NodeName=node02 CPUs=32 Boards=1 SocketsPerBoard=2 CoresPerSocket=16 ThreadsPerCore=1 RealMemory=257601
  4. NodeName=node04 CPUs=32 Boards=1 SocketsPerBoard=2 CoresPerSocket=16 ThreadsPerCore=1 RealMemory=257601
复制代码
在这里指定CPUs=48是最好的,既可以利用超线程,又不会超过48个物理核。

评分 Rate

参与人数
Participants 2
eV +6 收起 理由
Reason
Weldingspock + 5 谢谢
FUcreature + 1 正解

查看全部评分 View all ratings

197

帖子

1

威望

1104

eV
积分
1321

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2023-9-14 17:03:23 | 只看该作者 Only view this author
万里云 发表于 2023-9-14 16:59
在/etc/slurm/slurm.conf中有关于核数的配置,类似这样:
在这里指定CPUs=48是最好的,既可以利用超线程, ...

非常感谢您的建议!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 00:26 , Processed in 0.195026 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list