计算化学公社
标题:
slurm还有剩余核,但是提交作业就是PD状态
[打印本页]
作者Author:
qiuyunfeng
时间:
2024-1-22 17:17
标题:
slurm还有剩余核,但是提交作业就是PD状态
我在单台裸金属上装了slurm,一共72核,当我执行一个作业时用了16核,实际还剩下很多,但提交第二个作业的时候,作业就是PD状态,需要等到第一个结束了才能开始,不知道为什么。
求解
(, 下载次数 Times of downloads: 42)
上传 Uploaded
点击下载Click to download
(, 下载次数 Times of downloads: 40)
上传 Uploaded
点击下载Click to download
作者Author:
bluewhale
时间:
2024-1-22 19:32
slurm.conf 中 SelectTypeParameters是如何写的?
作者Author:
丁越
时间:
2024-1-23 09:12
本帖最后由 丁越 于 2024-1-23 09:14 编辑
如楼上所说,那个网页版工具配置slurm.conf的SelectTypeParameters默认是CR_Core_Memery,使得分配任务时不会仅基于cpu资源进行调度。解决办法有两个,一个是在提交任务的slurm脚本中添加控制单个任务的运行内存大小,使得单个任务不会占满整个可用内存容量,即添加如#SBATCH --mem=100GB参数。另一种做法是直接把SelectTypeParameters的参数改为CR_Core,仅对cpu资源进行分配调度。
作者Author:
糖炒DFT
时间:
2024-5-22 22:44
除了核心数是限制调度的原因外,可以检查是否是第一个任务提交时内存调用过多所导致。
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3