计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1239|回复 Reply: 9
打印 Print 上一主题 Last thread 下一主题 Next thread

[并行运算] RockyLinux10.0单机slurm安装脚本

[复制链接 Copy URL]

17

帖子

0

威望

974

eV
积分
991

Level 4 (黑子)

本帖最后由 南北多歧路 于 2025-7-8 17:25 编辑

本人琢磨过个人单机服务器的slurm安装一段时间,该脚本多次测试成功安装运行,由于是单机脚本故不涉及slurmdbd服务,安装更为简洁方便~
  • 本脚本修改自 github的多Linux发行版的slurm安装脚本 多机多节点的slurm编译务必参考slurm官方文档
  • 脚本的slurm.conf文件和cgroup文件最好参考 slurm.conf文件配置cgroup.conf配置 自己去配置适合自己本机的slurm.conf和cgroup文件
  • 如果懒得去修改注意脚本的ClusterName=fate SlurmctldHost=Avalon 前者ClusterName填写自己喜欢的名字即可,后者由于管理节点计算节点一体,需要修改成
    自己机器的hostname 同时修改NodeName=Avalon CPUs=192 RealMemory=500000 Sockets=2 CoresPerSocket=48 ThreadsPerCore=2 State=UNKNOWN
    PartitionName=saber Nodes=ALL Default=YES MaxTime=INFINITE State=UP ,其中NodeName仍然是自己服务器的hostname 后面分别是机器线程数、分配内存大小(MB)
    插槽数、是否开启超线程这些字段需要修改,其中CPUs=Sockets*CoresPerSocket*ThreadsPerCore,另外就是PartitionName可以命名成自己喜欢的名字~脚本的VER可以自定义
  • 网上的大多slurm安装完成出现问题后个人见解最大的因素是slurm.conf和cgroup.conf文件的小问题导致的,一定要参考其他人的对应文件调试,不同的slurm所需要的slurm.conf版本会有小不同。
  • 重新提交了一份安装脚本适配最新的rockylinux10安装slurm-25.05.0版本,其余版本自测也应该没问题
  • 如果曾经运行过脚本并且安装成功,需要升级slurm对应版本,这里提供一个思路,我自测成功,就是将# build and install SLURM部分安装的对应的包卸载掉,删除之前root目录下rpm_build残留的文件重新修改$VER为你想升级的版本重新将最开始 #!/bin/bash  VER=? # build and install SLURM #设置slurmctld和slurmd开机启动和后续的部分重新组成一个升级的脚本即可,实测可用~
如何使用 :
  1. sudo bash rockylinux.sh(脚本名)
复制代码



rockylinux.zip

2.55 KB, 阅读权限: 1, 下载次数 Times of downloads: 16

新脚本

评分 Rate

参与人数
Participants 7
eV +30 收起 理由
Reason
科学计算 + 3 谢谢
洛川i + 5 谢谢
gaogaoamm + 4 牛!
xyan11 + 5 谢谢分享
hit_liaols + 3 好物!过两天试试
dzdhp + 5 谢谢
sobereva + 5

查看全部评分 View all ratings

我才是旅途的终点!

144

帖子

0

威望

1432

eV
积分
1576

Level 5 (御坂)

2#
发表于 Post on 2025-4-3 11:13:41 | 只看该作者 Only view this author
简直就是刚饿就把饭喂我嘴里,太及时了,感谢大佬!
由衷感谢每位帮助我的好心人

18

帖子

0

威望

813

eV
积分
831

Level 4 (黑子)

3#
发表于 Post on 2025-4-5 06:37:22 | 只看该作者 Only view this author
强者

17

帖子

0

威望

974

eV
积分
991

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2025-4-5 11:41:11 | 只看该作者 Only view this author
dzdhp 发表于 2025-4-3 11:13
简直就是刚饿就把饭喂我嘴里,太及时了,感谢大佬!

能帮到你是最好的~
我才是旅途的终点!

17

帖子

0

威望

974

eV
积分
991

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2025-4-5 11:41:44 | 只看该作者 Only view this author

我只是小菜鸡一只,只是在论坛大佬指点下啃了下文档,遇到点坑,碰巧解决啦
我才是旅途的终点!

13

帖子

0

威望

90

eV
积分
103

Level 2 能力者

6#
发表于 Post on 2025-4-17 10:27:35 | 只看该作者 Only view this author
slurm需要加K8S一起在生产环境中会不会好用点呢?

2407

帖子

1

威望

5948

eV
积分
8375

Level 6 (一方通行)

7#
发表于 Post on 2025-4-17 14:10:03 | 只看该作者 Only view this author
enine 发表于 2025-4-17 10:27
slurm需要加K8S一起在生产环境中会不会好用点呢?

科学计算场景中使用的集群,
不是k8s。

k8s集群和科学计算集群,是两不同的概念。

正如k8s集群和Ceph集群,也是不同的概念。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

13

帖子

0

威望

90

eV
积分
103

Level 2 能力者

8#
发表于 Post on 2025-4-17 15:07:23 | 只看该作者 Only view this author
Ray 和slurm 呢?

45

帖子

4

威望

1082

eV
积分
1207

Level 4 (黑子)

9#
发表于 Post on 2025-5-15 12:26:21 | 只看该作者 Only view this author
过于麻烦了。既然能用dnf install,说明能联网,那么为什么不直接dnf install slurm呢?如果不能联网,那么脚本中所有dnf install的部分均需要修改

17

帖子

0

威望

974

eV
积分
991

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2025-7-8 17:09:38 | 只看该作者 Only view this author
Kamistry 发表于 2025-5-15 12:26
过于麻烦了。既然能用dnf install,说明能联网,那么为什么不直接dnf install slurm呢?如果不能联网,那么 ...
Install Slurm using one of the following methods:
Build RPM or DEB packages (recommended for production)
Build Manually from source (for developers or advanced users)
NOTE: Some Linux distributions may have unofficial Slurm packages available in software repositories. SchedMD does not maintain or recommend these packages.
引用一下官方手册的对应回复,这些包固然可以用,但是这种手动构建对应版本的包也可以被采纳
我才是旅途的终点!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 17:15 , Processed in 0.185673 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list