计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2003|回复 Reply: 13
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 8369B双路, 计算集群配置记录

[复制链接 Copy URL]

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 abin 于 2023-3-5 11:24 编辑

最新内容, 可以查阅
https://gitee.com/hpc4you/redstar/blob/master/deploy_note.md

Gitee 上的排版稍微清晰一点。
RedStar集群部署记录
以下记录课题组新购置集群RedStar的配置备忘录.
年末, 学校财务快封账了, 课题组长忽然说, 现有的机器年头久了, 买几台新机器吧.
就不到三周时间了, 时间紧, 任务重.
调研需求
当然是几个工作室溜达一圈, 当面问问同事, 可以买几个新机器, 想跑啥程序? 有啥需求?
很快就有了结果:
  • 内存越大越好, 跑VASP方便
  • 也会跑高斯
  • 不要AMD处理器
查看了旧集群的Ganglia历史监控数据, 分析发现:
  • VASP计算, 一个CPU核心配备6GB内存, 可以满足计算需求.
  • Gaussian计算, 一个CPU核心配备至少2GB是可行的.
硬件配置
楼里的供货商, 常来的就两家. 打电话聊了下, 8375C没货, 只有8369B.
问了大概的报价, 再结合预算, 确定了如下的硬件方案:
  • 节点内多核心并行
  • 本地I/O
  • 板载千兆网络
  • 管理、登录、存储合一
计算节点
  • 处理器, 8369B双路, 核心多主频高, 价格适中
  • 内存, 32GB, 16条, 保证开启所有内存通道, 也满足VASP内存需求
  • 系统盘, 240GB SATA固态
  • 本地I/O, NVMe 1TB一个, 挂载/tmp
  • 2U机架式, 双电源
  • 网卡1 集群IPMI
  • 网卡2 管理+数据网络
系统盘, 其实30GB都可以了. 实际上, 120GB的没货, 最便宜的只有240GB规格了.
网卡1和网卡2, 设定在同一个局域网段, 都采用192.168.100.0/24.
管理节点
  • 处理器, 8156双路, 开启超线程
  • 内存, 32GB两条
  • 系统盘, 240GB SATA固态
  • 软件硬盘, 1TB SATA固态
  • 数据硬盘, 16TB SATA机械
  • 备份硬盘, 16TB SATA机械
  • 网卡1 IPMI接口
  • 网卡2 管理+数据网络
  • 网卡3 实验室内线, 配置为192.9.200.200/24, 网关192.9.200.254.
注意, 网卡1, IPMI接入到实验室内线; 网卡2, 指定地址为192.168.100.254.
网络
预算有限, 当然是限定:
  • 本地I/O
  • 单节点内多核心并行
  • 计算节点IPMI和集群数据采用同一个局域网
  • 主控节点, IPMI接入到实验室内线, 单独网卡, 接入实验室内线
  • 送货前, 标注并按照要求配置好各个网络接口
IPMI配置说明
配置逻辑是,
  • 通过实验室内线, 控制主控机器开关机
  • 主控机器和计算节点, 在一个局域网; 主控机器开机后, 通过ipmitool控制其他机器开机.
机器上架硬件设定
我们要求, 硬件供货商, 按照如下要求, 给每台机器安装系统:
  • 采用Rocky 8.7
  • 系统盘, 默认使用全盘, 不再手动分区
  • 仅仅开启root用户, 不额外创建任何用户
  • 以太网和IPMI按照要求配置好
  • NVMe硬盘, 都挂载到/tmp
  • 按照前文要求, 配置各个网络接口
如果是我来操作, 可能:
  • PXE自动安装, 或者
  • 硬盘克隆
至于硬件商怎么安装系统, 那不必操心, 达到目的就行了.
显然, 涉及到拆掉部分旧机器, 然后安装新机器. 新机器上架, 花费了一点时间.
按照事先要求, 接好网线, 开机后, 通过实验室内线顺利进入新机器, 确认:
  • 集群局域网工作
  • IPMI操作所有机器远程关机, 开机, 都符合预期
网络配置确认, 只用了10分钟, 然后电话告诉硬件商, 硬件验收完毕, 可以走人了.
当然, 整个过程中, 我只是到现场告诉他们应该如何操作. 我告诉他们要拆下哪些机器, 该按照什么顺序安装新机器, 以及内线交换机的位置. 然后, 我就离开了. 机房风劲、冰冷、噪音隆隆. 我一秒钟也不想待在那里.
集群系统
采用本人开发的hpc4you toolkit v3.0 web.
采用hpc4you toolkit协助好多课题组部署过集群了, 给自己的机器操作, 还是第一次.
调试网络
实验室内线当然是没有互联网的.
hpc4you toolkit依赖dnf通过网络安装缺失的组件.
所以, 第一件事情就是让处于内线的机器, 具有互联网链接了.
工作室的机器, 可以访问内线, 也可以访问互联网(校园网). 那问题就简单了:
  • 工作室找一台Linux机器, 显然可以访问内线和互联网, 在内线接口运行wireguard服务端.
  • 主控节点, 显然在送货前就配置有wireguard客户端
  • 主控节点, 运行NAT网关, 所有计算节点通过主控节点访问网络
发送WG配置文件, 并bypass内线网络, 启用WG, 看到如下信息:
  1. [root@redstar ~]# ifconfig
  2. eno1: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
  3.         inet 192.168.100.254  netmask 255.255.255.0  broadcast 192.168.100.255
  4.         ether ac:1f:6b:db:24:92  txqueuelen 1000  (Ethernet)
  5.         RX packets <a href="tel:1341170249">1341170249</a>  bytes <a href="tel:1843273050632">1843273050632</a> (1.6 TiB)
  6.         RX errors 0  dropped 0  overruns 0  frame 0
  7.         TX packets 450581852  bytes 184383348369 (171.7 GiB)
  8.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  9. eno2: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
  10.         inet 192.9.200.200  netmask 255.255.255.255  broadcast 0.0.0.0
  11.         ether ac:1f:6b:db:24:93  txqueuelen 1000  (Ethernet)
  12.         RX packets 53664217  bytes <a href="tel:27454263284">27454263284</a> (25.5 GiB)
  13.         RX errors 0  dropped 0  overruns 0  frame 0
  14.         TX packets 17787634  bytes <a href="tel:8712212221">8712212221</a> (8.1 GiB)
  15.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  16. hpc: flags=209<UP,POINTOPOINT,RUNNING,NOARP>  mtu 1420
  17.         inet 10.8.0.2  netmask 255.255.255.0  destination 10.8.0.2
  18.         unspec 00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00  txqueuelen 1000  (UNSPEC)
  19.         RX packets <a href="tel:1948393">1948393</a>  bytes <a href="tel:2618913160">2618913160</a> (2.4 GiB)
  20.         RX errors 0  dropped 0  overruns 0  frame 0
  21.         TX packets <a href="tel:1079516">1079516</a>  bytes 169497364 (161.6 MiB)
  22.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  23. lo: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
  24.         inet 127.0.0.1  netmask 255.0.0.0
  25.         loop  txqueuelen 1000  (Local Loopback)
  26.         RX packets 23026904  bytes <a href="tel:10924417750">10924417750</a> (10.1 GiB)
  27.         RX errors 0  dropped 0  overruns 0  frame 0
  28.         TX packets 23026904  bytes <a href="tel:10924417750">10924417750</a> (10.1 GiB)
  29.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  30. [root@redstar ~]#
复制代码



显然, 我指定的WG网卡名称是hpc.
NAT网关设定, 来自 (https://gitee.com/hpc4you/linux/blob/master/nat.sh), 修改一下网卡名称和网段就可以了.
安装集群系统
  • 显然, 各个机器的root密码是一样的, 111111
  • 在主节点, 编辑/etc/hosts, 录入机器的名字和IP地址, 指定neusoft.repo, 这个很快
  • 运行hpc4you toolkit, 按照屏幕提示操作即可
然后, 我也没有去过机房, 集群就搞定了.
应用软件
编译调试好的singularity/apptainer镜像, 运行效率和本机直接运行, 几乎没有差异. 如有差异, 可能就多十来秒.
通过singularity/apptainer镜像封装的程序, 只要保证支持目标机器上的指令集, 即可保证最佳运行效率.
显然, 我封装的源码编译的程序镜像, 都默认支持了AVX512/AVX2/SSE4.2指令集. 这些下载即用的镜像, 并非部分官方提供的预编译二进制那么简单.
VASP
采用singularity镜像, 就是这里提供的版本 (https://pan.baidu.com/s/1r7PduYXqjn3kpS-ie0H8NQ?pwd=aknc).
镜像较大, 上传需要一点时间.
Gaussian
采用singularity镜像, 就是这里提供的版本 (https://pan.baidu.com/s/1r7PduYXqjn3kpS-ie0H8NQ?pwd=aknc).
镜像较大, 上传需要一点时间.
启用集群
管理员在自己的机器编辑/etc/hosts文件, 写入:
192.9.200.200 hpc4you.login


录入用户
通过Web前端接入LDAP管理用户信息.
录入用户信息需要管理员操作.
创建队列
这个需要管理员, ssh在指令行操作.
需要登录到主控节点, 根据实际, 创建几个不同的QoS.
资源管理系统用户访问
所有用户, 浏览器访问 (http://hpc4you.login), 可以实现:
  • 点击鼠标, 向队列提交计算任务
  • 点击鼠标, 修改输入文件, 脚本文件
  • 点击鼠标, 上传下载文件
  • 点击鼠标, 复制、移动文件
  • 点击鼠标, 直接打开Linux桌面, 运行图形界面程序, 比如GaussView, VMD; 或者用Firefox上网.
显然, 也支持传统的SSH访问模式.
无论是Web端, 还是SSH模式, 所有计算任务, 都是通过slurm自动调度的.
网络访问
在实验室内线, 千兆局域网.
通过互联网也可以访问呀. 对, 就是在家用宽带, 也可以访问呀.
显然, 工作室能访问互联网的机器, 仅仅是个教育网的多重NAT的局域网, 使用Tailscale搞一下, 就可以了. 访问效果, 取决于用户网络.
目前测试, 电信宽带/4G/5G热点, 移动宽带/4G/5G热点, 都很稳定. 延时大约30ms以内. 家里是千兆宽带, 晚间访问服务器, 下载文件, 能维持在6 - 8MB/s. Web端十分顺畅.
上了年纪的同事, 喜欢SSH模式. 学生, 很喜欢Web模式.
最耗时的环节
hpc4you toolkit, 也就是30分钟吧. 因为neusoft在我这里, 可以跑到40MB/s.
最浪费时间的, 不是编写脚本, 而是不停调整脚本的说明, 以达到, 所有用户/学生看了后, 不再理解错.
你永远想不到, 一知半解(不仔细阅读文字)的学生, 如何异想天开的修改脚本参数.


评分 Rate

参与人数
Participants 2
eV +10 收起 理由
Reason
tanyazhi + 5 好物!
anson + 5 不明觉厉

查看全部评分 View all ratings

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

14#
 楼主 Author| 发表于 Post on 2023-4-25 13:26:16 | 只看该作者 Only view this author
补充一个信息.

同一个计算任务, 使用g09e01, 32个核心, slurm调度.
测试机器还在跑ORCA计算.

耗时如下:
8375C   48分钟  读写未知 集群
8369B   39分钟  本地读写 hpc4you集群方案

扣除磁盘因素  可以认为, 两个处理器性能是类似的.

所以, 市场上有啥, 哪个价格合适, 就买哪一个.

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

13#
 楼主 Author| 发表于 Post on 2023-3-30 22:02:24 | 只看该作者 Only view this author
alwens 发表于 2023-3-30 21:19
请教下,我用的是slurm队列管理,总有几个节点运行作业的时候sinfo 显示drng 这个状态,算完会恢复。如果用 ...

不了解。

我使用过程用,未遇到你说的情形。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

161

帖子

0

威望

2635

eV
积分
2796

Level 5 (御坂)

12#
发表于 Post on 2023-3-30 21:19:05 | 只看该作者 Only view this author
请教下,我用的是slurm队列管理,总有几个节点运行作业的时候sinfo 显示drng 这个状态,算完会恢复。如果用scontrol resume 恢复,过一会还会显示drng
很神奇的是,无论跑vasp还是gaussian都这样
这几个节点是8176的cpu
但最新买的8375,3836 8350系列的没问题。

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

11#
 楼主 Author| 发表于 Post on 2023-3-14 12:14:54 | 只看该作者 Only view this author
jackyjj123 发表于 2023-3-14 11:30
为啥不选AMD处理器,是因为socket-socket的延迟比xeon高吗?

有同事说,拒绝使用AMD。

其他人没有明确要求。

那就是不选择AMD处理器了。

决策过程就这么简单。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

9

帖子

0

威望

39

eV
积分
48

Level 2 能力者

10#
发表于 Post on 2023-3-14 11:30:11 | 只看该作者 Only view this author
为啥不选AMD处理器,是因为socket-socket的延迟比xeon高吗?

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

9#
 楼主 Author| 发表于 Post on 2023-3-6 11:02:54 | 只看该作者 Only view this author
本帖最后由 abin 于 2023-3-6 11:04 编辑

先配置ssh key,网上资料很多
也可以参考我的视频
【windows-MobaXterm-ssh无密码登录-哔哩哔哩】 https://b23.tv/y8hcODe

然后,按Tab就可以补全远程地址了。

这是使用指令行的必备技能呀……

指令或者路径,敲前一两个字母就行了,按Tab自动补全或者提示

所以,建议指令模式,不要使用中文文件名。

这个也可以【使用Linux桌面环境进行日常计算工作-哔哩哔哩】 https://b23.tv/mNQaSTw

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

362

帖子

1

威望

4368

eV
积分
4750

Level 6 (一方通行)

8#
发表于 Post on 2023-3-6 09:56:00 | 只看该作者 Only view this author
abin 发表于 2023-3-6 09:43
先搞定ssh key
然后就可以按Tab,自动补全了
不用手写的。

可以细说一下吗?

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

7#
 楼主 Author| 发表于 Post on 2023-3-6 09:43:08 | 只看该作者 Only view this author
exity 发表于 2023-3-6 06:47
是的,scp写路径地址太麻烦了。其他都不需要借助图形界面就能很好的完成工作。

先搞定ssh key
然后就可以按Tab,自动补全了
不用手写的。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

362

帖子

1

威望

4368

eV
积分
4750

Level 6 (一方通行)

6#
发表于 Post on 2023-3-6 06:47:07 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-3-5 18:11
我比较习惯用SSH敲命令完成一些复杂的主要操作,用samba或nfs与PC共享文件(能直接挂载成网络驱动器才是 ...

是的,scp写路径地址太麻烦了。其他都不需要借助图形界面就能很好的完成工作。

846

帖子

16

威望

4634

eV
积分
5800

Level 6 (一方通行)

小屁孩

5#
发表于 Post on 2023-3-5 19:11:56 | 只看该作者 Only view this author
abin 发表于 2023-3-5 18:40
新来的学生,对于网络或者互联网的认知,基本都是从手机开始的。

他们非常抗拒这种上古的操作方式。

现在许多生活常用的软件都在按照web的模式来开发,主要好处是移植成本几乎为零。万物浏览器化确实是一个趋势。我作为00后中“上了年纪”的人,也不能守着老古董了
- 向着虚无前进 -

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
 楼主 Author| 发表于 Post on 2023-3-5 18:40:51 | 只看该作者 Only view this author
Entropy.S.I 发表于 2023-3-5 18:11
我比较习惯用SSH敲命令完成一些复杂的主要操作,用samba或nfs与PC共享文件(能直接挂载成网络驱动器才是 ...

新来的学生,对于网络或者互联网的认知,基本都是从手机开始的。

他们非常抗拒这种上古的操作方式。

对我来说,指令更加方便。

如果使用Linux/Mac,直接使用sshfs ,啥文件都是本地操作。

或者Linux 桌面中,添加了sftp 快捷方式,
也是点鼠标操作服务器上的文件。

我很少用微软,我觉得,对于00后,
以及那些键盘都不熟悉的学生,又抗拒指令操作,
那么,在浏览器中点鼠标,应该是最佳的选择。

反正有浏览器就行了。

当然这个浏览器也有一个shell ,可以指令模式。

这么算下来,用户只要有浏览器就可以了。

不过我没有测试国产浏览器。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

846

帖子

16

威望

4634

eV
积分
5800

Level 6 (一方通行)

小屁孩

3#
发表于 Post on 2023-3-5 18:11:49 | 只看该作者 Only view this author
exity 发表于 2023-3-5 14:58
"上了年纪的同事, 喜欢SSH模式. 学生, 很喜欢Web模式."...

我比较习惯用SSH敲命令完成一些复杂的主要操作,用samba或nfs与PC共享文件(能直接挂载成网络驱动器才是最方便的)
- 向着虚无前进 -

362

帖子

1

威望

4368

eV
积分
4750

Level 6 (一方通行)

2#
发表于 Post on 2023-3-5 14:58:49 | 只看该作者 Only view this author
"上了年纪的同事, 喜欢SSH模式. 学生, 很喜欢Web模式."...

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
ChrisZheng + 5 233333

查看全部评分 View all ratings

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:39 , Processed in 0.609639 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list