计算化学公社

标题: 8369B双路, 计算集群配置记录 [打印本页]

作者
Author:
abin    时间: 2023-3-4 22:19
标题: 8369B双路, 计算集群配置记录
本帖最后由 abin 于 2023-3-5 11:24 编辑

最新内容, 可以查阅
https://gitee.com/hpc4you/redstar/blob/master/deploy_note.md

Gitee 上的排版稍微清晰一点。
RedStar集群部署记录
以下记录课题组新购置集群RedStar的配置备忘录.
年末, 学校财务快封账了, 课题组长忽然说, 现有的机器年头久了, 买几台新机器吧.
就不到三周时间了, 时间紧, 任务重.
调研需求
当然是几个工作室溜达一圈, 当面问问同事, 可以买几个新机器, 想跑啥程序? 有啥需求?
很快就有了结果:
查看了旧集群的Ganglia历史监控数据, 分析发现:
硬件配置
楼里的供货商, 常来的就两家. 打电话聊了下, 8375C没货, 只有8369B.
问了大概的报价, 再结合预算, 确定了如下的硬件方案:
计算节点
系统盘, 其实30GB都可以了. 实际上, 120GB的没货, 最便宜的只有240GB规格了.
网卡1和网卡2, 设定在同一个局域网段, 都采用192.168.100.0/24.
管理节点
注意, 网卡1, IPMI接入到实验室内线; 网卡2, 指定地址为192.168.100.254.
网络
预算有限, 当然是限定:
IPMI配置说明
配置逻辑是,
机器上架硬件设定
我们要求, 硬件供货商, 按照如下要求, 给每台机器安装系统:
如果是我来操作, 可能:
至于硬件商怎么安装系统, 那不必操心, 达到目的就行了.
显然, 涉及到拆掉部分旧机器, 然后安装新机器. 新机器上架, 花费了一点时间.
按照事先要求, 接好网线, 开机后, 通过实验室内线顺利进入新机器, 确认:
网络配置确认, 只用了10分钟, 然后电话告诉硬件商, 硬件验收完毕, 可以走人了.
当然, 整个过程中, 我只是到现场告诉他们应该如何操作. 我告诉他们要拆下哪些机器, 该按照什么顺序安装新机器, 以及内线交换机的位置. 然后, 我就离开了. 机房风劲、冰冷、噪音隆隆. 我一秒钟也不想待在那里.
集群系统
采用本人开发的hpc4you toolkit v3.0 web.
采用hpc4you toolkit协助好多课题组部署过集群了, 给自己的机器操作, 还是第一次.
调试网络
实验室内线当然是没有互联网的.
hpc4you toolkit依赖dnf通过网络安装缺失的组件.
所以, 第一件事情就是让处于内线的机器, 具有互联网链接了.
工作室的机器, 可以访问内线, 也可以访问互联网(校园网). 那问题就简单了:
发送WG配置文件, 并bypass内线网络, 启用WG, 看到如下信息:
  1. [root@redstar ~]# ifconfig
  2. eno1: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
  3.         inet 192.168.100.254  netmask 255.255.255.0  broadcast 192.168.100.255
  4.         ether ac:1f:6b:db:24:92  txqueuelen 1000  (Ethernet)
  5.         RX packets <a href="tel:1341170249">1341170249</a>  bytes <a href="tel:1843273050632">1843273050632</a> (1.6 TiB)
  6.         RX errors 0  dropped 0  overruns 0  frame 0
  7.         TX packets 450581852  bytes 184383348369 (171.7 GiB)
  8.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  9. eno2: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
  10.         inet 192.9.200.200  netmask 255.255.255.255  broadcast 0.0.0.0
  11.         ether ac:1f:6b:db:24:93  txqueuelen 1000  (Ethernet)
  12.         RX packets 53664217  bytes <a href="tel:27454263284">27454263284</a> (25.5 GiB)
  13.         RX errors 0  dropped 0  overruns 0  frame 0
  14.         TX packets 17787634  bytes <a href="tel:8712212221">8712212221</a> (8.1 GiB)
  15.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  16. hpc: flags=209<UP,POINTOPOINT,RUNNING,NOARP>  mtu 1420
  17.         inet 10.8.0.2  netmask 255.255.255.0  destination 10.8.0.2
  18.         unspec 00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00  txqueuelen 1000  (UNSPEC)
  19.         RX packets <a href="tel:1948393">1948393</a>  bytes <a href="tel:2618913160">2618913160</a> (2.4 GiB)
  20.         RX errors 0  dropped 0  overruns 0  frame 0
  21.         TX packets <a href="tel:1079516">1079516</a>  bytes 169497364 (161.6 MiB)
  22.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  23. lo: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
  24.         inet 127.0.0.1  netmask 255.0.0.0
  25.         loop  txqueuelen 1000  (Local Loopback)
  26.         RX packets 23026904  bytes <a href="tel:10924417750">10924417750</a> (10.1 GiB)
  27.         RX errors 0  dropped 0  overruns 0  frame 0
  28.         TX packets 23026904  bytes <a href="tel:10924417750">10924417750</a> (10.1 GiB)
  29.         TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

  30. [root@redstar ~]#
复制代码



显然, 我指定的WG网卡名称是hpc.
NAT网关设定, 来自 (https://gitee.com/hpc4you/linux/blob/master/nat.sh), 修改一下网卡名称和网段就可以了.
安装集群系统
然后, 我也没有去过机房, 集群就搞定了.
应用软件
编译调试好的singularity/apptainer镜像, 运行效率和本机直接运行, 几乎没有差异. 如有差异, 可能就多十来秒.
通过singularity/apptainer镜像封装的程序, 只要保证支持目标机器上的指令集, 即可保证最佳运行效率.
显然, 我封装的源码编译的程序镜像, 都默认支持了AVX512/AVX2/SSE4.2指令集. 这些下载即用的镜像, 并非部分官方提供的预编译二进制那么简单.
VASP
采用singularity镜像, 就是这里提供的版本 (https://pan.baidu.com/s/1r7PduYXqjn3kpS-ie0H8NQ?pwd=aknc).
镜像较大, 上传需要一点时间.
Gaussian
采用singularity镜像, 就是这里提供的版本 (https://pan.baidu.com/s/1r7PduYXqjn3kpS-ie0H8NQ?pwd=aknc).
镜像较大, 上传需要一点时间.
启用集群
管理员在自己的机器编辑/etc/hosts文件, 写入:
192.9.200.200 hpc4you.login


录入用户
访问(https://hpc4you.login:8404/users).
通过Web前端接入LDAP管理用户信息.
录入用户信息需要管理员操作.
创建队列
这个需要管理员, ssh在指令行操作.
需要登录到主控节点, 根据实际, 创建几个不同的QoS.
资源管理系统用户访问
所有用户, 浏览器访问 (http://hpc4you.login), 可以实现:
显然, 也支持传统的SSH访问模式.
无论是Web端, 还是SSH模式, 所有计算任务, 都是通过slurm自动调度的.
网络访问
在实验室内线, 千兆局域网.
通过互联网也可以访问呀. 对, 就是在家用宽带, 也可以访问呀.
显然, 工作室能访问互联网的机器, 仅仅是个教育网的多重NAT的局域网, 使用Tailscale搞一下, 就可以了. 访问效果, 取决于用户网络.
目前测试, 电信宽带/4G/5G热点, 移动宽带/4G/5G热点, 都很稳定. 延时大约30ms以内. 家里是千兆宽带, 晚间访问服务器, 下载文件, 能维持在6 - 8MB/s. Web端十分顺畅.
上了年纪的同事, 喜欢SSH模式. 学生, 很喜欢Web模式.
最耗时的环节
hpc4you toolkit, 也就是30分钟吧. 因为neusoft在我这里, 可以跑到40MB/s.
最浪费时间的, 不是编写脚本, 而是不停调整脚本的说明, 以达到, 所有用户/学生看了后, 不再理解错.
你永远想不到, 一知半解(不仔细阅读文字)的学生, 如何异想天开的修改脚本参数.



作者
Author:
exity    时间: 2023-3-5 14:58
"上了年纪的同事, 喜欢SSH模式. 学生, 很喜欢Web模式."...
作者
Author:
Entropy.S.I    时间: 2023-3-5 18:11
exity 发表于 2023-3-5 14:58
"上了年纪的同事, 喜欢SSH模式. 学生, 很喜欢Web模式."...

我比较习惯用SSH敲命令完成一些复杂的主要操作,用samba或nfs与PC共享文件(能直接挂载成网络驱动器才是最方便的)
作者
Author:
abin    时间: 2023-3-5 18:40
Entropy.S.I 发表于 2023-3-5 18:11
我比较习惯用SSH敲命令完成一些复杂的主要操作,用samba或nfs与PC共享文件(能直接挂载成网络驱动器才是 ...

新来的学生,对于网络或者互联网的认知,基本都是从手机开始的。

他们非常抗拒这种上古的操作方式。

对我来说,指令更加方便。

如果使用Linux/Mac,直接使用sshfs ,啥文件都是本地操作。

或者Linux 桌面中,添加了sftp 快捷方式,
也是点鼠标操作服务器上的文件。

我很少用微软,我觉得,对于00后,
以及那些键盘都不熟悉的学生,又抗拒指令操作,
那么,在浏览器中点鼠标,应该是最佳的选择。

反正有浏览器就行了。

当然这个浏览器也有一个shell ,可以指令模式。

这么算下来,用户只要有浏览器就可以了。

不过我没有测试国产浏览器。
作者
Author:
Entropy.S.I    时间: 2023-3-5 19:11
abin 发表于 2023-3-5 18:40
新来的学生,对于网络或者互联网的认知,基本都是从手机开始的。

他们非常抗拒这种上古的操作方式。

现在许多生活常用的软件都在按照web的模式来开发,主要好处是移植成本几乎为零。万物浏览器化确实是一个趋势。我作为00后中“上了年纪”的人,也不能守着老古董了
作者
Author:
exity    时间: 2023-3-6 06:47
Entropy.S.I 发表于 2023-3-5 18:11
我比较习惯用SSH敲命令完成一些复杂的主要操作,用samba或nfs与PC共享文件(能直接挂载成网络驱动器才是 ...

是的,scp写路径地址太麻烦了。其他都不需要借助图形界面就能很好的完成工作。
作者
Author:
abin    时间: 2023-3-6 09:43
exity 发表于 2023-3-6 06:47
是的,scp写路径地址太麻烦了。其他都不需要借助图形界面就能很好的完成工作。

先搞定ssh key
然后就可以按Tab,自动补全了
不用手写的。
作者
Author:
exity    时间: 2023-3-6 09:56
abin 发表于 2023-3-6 09:43
先搞定ssh key
然后就可以按Tab,自动补全了
不用手写的。

可以细说一下吗?
作者
Author:
abin    时间: 2023-3-6 11:02
本帖最后由 abin 于 2023-3-6 11:04 编辑

先配置ssh key,网上资料很多
也可以参考我的视频
【windows-MobaXterm-ssh无密码登录-哔哩哔哩】 https://b23.tv/y8hcODe

然后,按Tab就可以补全远程地址了。

这是使用指令行的必备技能呀……

指令或者路径,敲前一两个字母就行了,按Tab自动补全或者提示

所以,建议指令模式,不要使用中文文件名。

这个也可以【使用Linux桌面环境进行日常计算工作-哔哩哔哩】 https://b23.tv/mNQaSTw


作者
Author:
jackyjj123    时间: 2023-3-14 11:30
为啥不选AMD处理器,是因为socket-socket的延迟比xeon高吗?
作者
Author:
abin    时间: 2023-3-14 12:14
jackyjj123 发表于 2023-3-14 11:30
为啥不选AMD处理器,是因为socket-socket的延迟比xeon高吗?

有同事说,拒绝使用AMD。

其他人没有明确要求。

那就是不选择AMD处理器了。

决策过程就这么简单。
作者
Author:
alwens    时间: 2023-3-30 21:19
请教下,我用的是slurm队列管理,总有几个节点运行作业的时候sinfo 显示drng 这个状态,算完会恢复。如果用scontrol resume 恢复,过一会还会显示drng
很神奇的是,无论跑vasp还是gaussian都这样
这几个节点是8176的cpu
但最新买的8375,3836 8350系列的没问题。
作者
Author:
abin    时间: 2023-3-30 22:02
alwens 发表于 2023-3-30 21:19
请教下,我用的是slurm队列管理,总有几个节点运行作业的时候sinfo 显示drng 这个状态,算完会恢复。如果用 ...

不了解。

我使用过程用,未遇到你说的情形。

作者
Author:
abin    时间: 2023-4-25 13:26
补充一个信息.

同一个计算任务, 使用g09e01, 32个核心, slurm调度.
测试机器还在跑ORCA计算.

耗时如下:
8375C   48分钟  读写未知 集群
8369B   39分钟  本地读写 hpc4you集群方案

扣除磁盘因素  可以认为, 两个处理器性能是类似的.

所以, 市场上有啥, 哪个价格合适, 就买哪一个.






欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3