计算化学公社

标题: 【已解决】求助:MaterialsStudio 2020以下版本在RHEL/CentOS 8系统的运行 [打印本页]

作者
Author:
wuy069    时间: 2022-9-5 16:18
标题: 【已解决】求助:MaterialsStudio 2020以下版本在RHEL/CentOS 8系统的运行
本帖最后由 wuy069 于 2022-10-10 14:11 编辑

最近集群系统统一安装了Rocky Linux 8.6,但在运行MaterialsStudio 2020及以下版本时总出现问题,Dmol3和Castep总不占用CPU进程。
Google搜索,是因为Intel mpi 2018在较新系统版本运行MPI任务会直接报错Segmentation Fault。根据“在较新的Linux系统中使用Materials Studio 2019和旧版Intel MPI | 世事如棋 (wangruixing.cn)”这篇博客操作,依然没解决问题,也询问博主了,他说“这个方法还是有局限性 有些模块不识别设置的环境变量 就仍然用不了”。
然后就想到用singularity容器运行MaterialsStudio 2020, 安装singularity,使用沙盒创建CentOS 7.9容器目录,在CentOS 7.9中安装依赖和MaterialsStudio 2019或2020软件,最后把容器目录转化为sif容器镜像。
然而运行时还是出现不占用CPU进程问题,singularity exec /opt/soft/ms2019.sif /opt/BIOVIA/MaterialsStudio19.1/etc/CASTEP/bin/RunCASTEP.sh -np 8 test test_DOS &

请教下各位,是我singularity设置的环境不全还是什么问题?

作者
Author:
sobereva    时间: 2022-9-5 20:30
不要在本论坛求商业软件下载,注意看置顶的社员必读贴。已把你帖子里的相关部分抹了
作者
Author:
abin    时间: 2022-9-5 21:50
本帖最后由 abin 于 2022-9-5 22:01 编辑

因为有一个严重的bug 要修正呀……不便于在这里讨论。
另,用什么网络?
单机多核心并行,还是多机器并行?

不过,商业软件,直接找技术服务呀。


作者
Author:
wuy069    时间: 2022-9-5 22:02
sobereva 发表于 2022-9-5 20:30
不要在本论坛求商业软件下载,注意看置顶的社员必读贴。已把你帖子里的相关部分抹了

好的,谢谢社长,下次注意了!
作者
Author:
wuy069    时间: 2022-9-5 22:06
abin 发表于 2022-9-5 21:50
因为有一个严重的bug 要修正呀……不便于在这里讨论。
另,用什么网络?
单机多核心并行,还是多机器并行 ...

谢谢王老师!网络用的是千兆网络,目前是单机多核并行都没解决了。
王老师,您说的严重bug,请问是?修复这个就能正常运行吗,能否站内私信指导下,谢谢!
作者
Author:
abin    时间: 2022-9-5 22:25
wuy069 发表于 2022-9-5 22:06
谢谢王老师!网络用的是千兆网络,目前是单机多核并行都没解决了。
王老师,您说的严重bug,请问是?修 ...

我没功夫测试……
你自己捣鼓吧。

或者你先找技术服务吧。

这是有商业版权的东西,我不便掺乎。
作者
Author:
wuy069    时间: 2022-9-5 22:31
abin 发表于 2022-9-5 22:25
我没功夫测试……
你自己捣鼓吧。

也没说让你测试啊,只是讨论下singularity容器技术而已,您说有bug,只是指点下就这么吝啬啊[😂],感谢讨论[抱拳]。
作者
Author:
abin    时间: 2022-9-5 22:33
wuy069 发表于 2022-9-5 22:31
也没说让你测试啊,只是讨论下singularity容器技术而已,您说有bug,只是指点下就这么吝啬啊[&#128514 ...

CSDN有我分享的singularity 资料,也许可以看看。

我真没有功夫帮你找。

我没功夫测试,所以没法说,是否有效。
作者
Author:
wuy069    时间: 2022-9-5 22:36
abin 发表于 2022-9-5 22:33
CSDN有我分享的singularity 资料,也许可以看看。

我真没有功夫帮你找。

好的,我拜读下,谢谢!
作者
Author:
wuy069    时间: 2022-9-5 22:47
abin 发表于 2022-9-5 22:33
CSDN有我分享的singularity 资料,也许可以看看。

我真没有功夫帮你找。

拜读了您的作品,但并没找到我需要的。VASP、Gaussian、ORCA这些,我用Singularity并没问题。
我还是把其中几个节点降级成CentOS 7.9来解决我的需求吧。
作者
Author:
abin    时间: 2022-9-5 23:34
本帖最后由 abin 于 2022-9-5 23:42 编辑
wuy069 发表于 2022-9-5 22:47
拜读了您的作品,但并没找到我需要的。VASP、Gaussian、ORCA这些,我用Singularity并没问题。
我还是把 ...

我怎么能发送一个视频给你?

我顺手在虚拟机中组了一个集群。
由于管控的缘故,网络很通畅,dnf 可以高达20MB/s
利用我的工具套件很快做了一个测试集群。

我测试了一个例子,能跑。

不晓得你的计算,是跑多久出现的问题,或者是一直不能顺利运行。

主机,Ubuntu 20.04
Vbox 虚拟机,用Rocky 8做集群。
集群工具,是我写的hpc4you_toolkit。
测试的是ms2019 castep。

完毕。我不清楚这玩意跑时间长了会不会挂。

作者
Author:
wuy069    时间: 2022-9-6 07:53
abin 发表于 2022-9-5 23:34
我怎么能发送一个视频给你?

我顺手在虚拟机中组了一个集群。

太麻烦王老师了[抱拳]!如果视频不大,能否传到百度或阿里云盘,给个分享链接就行,非常感谢!
作者
Author:
abin    时间: 2022-9-6 10:11
wuy069 发表于 2022-9-6 07:53
太麻烦王老师了[抱拳]!如果视频不大,能否传到百度或阿里云盘,给个分享链接就行,非常感谢!

查验PM信息.
作者
Author:
abin    时间: 2022-9-6 10:12
wuy069 发表于 2022-9-5 22:47
拜读了您的作品,但并没找到我需要的。VASP、Gaussian、ORCA这些,我用Singularity并没问题。
我还是把 ...

你用了这么快的时间, 就看了你认为重要的东西.

可是我认为你根本就没有看你应该看的东西.

你应该融会贯通一下这个吧?

https://blog.csdn.net/hpc4you/article/details/124325276

作者
Author:
wuy069    时间: 2022-9-6 10:32
abin 发表于 2022-9-6 10:12
你用了这么快的时间, 就看了你认为重要的东西.

可是我认为你根本就没有看你应该看的东西.

十分感谢王老师花这么多时间测试!
哦,可能吧,我自己再找找问题吧。
作者
Author:
abin    时间: 2022-9-6 10:53
(, 下载次数 Times of downloads: 15)

Running....
作者
Author:
wuy069    时间: 2022-9-6 11:27
abin 发表于 2022-9-6 10:53
Running....

我刚才建了个虚拟机,rocky linux 8.6,使用singularity运行MS的确没问题,但是实体机就是不好使,特别奇怪[笑哭]。
再次感谢王老师!
作者
Author:
wuy069    时间: 2022-9-6 14:49
abin 发表于 2022-9-6 10:12
你用了这么快的时间, 就看了你认为重要的东西.

可是我认为你根本就没有看你应该看的东西.

这些对我来说并不难,我也不是一个新手,只是想讨论找到问题的症结。简单极速高效构建高性能计算集群https://www.bilibili.com/video/BV1434y1j75R?spm_id_from=444.42.list.card_archive.click&vd_source=4147cbee137da2d405cd809d90528c4b
这个是我做的,希望有机会和王老师多交流讨论[抱拳]!

作者
Author:
abin    时间: 2022-9-6 19:24
wuy069 发表于 2022-9-6 14:49
这些对我来说并不难,我也不是一个新手,只是想讨论找到问题的症结。简单极速高效构建高性能计算集群http ...

可能指出哪里出错了,很不礼貌。

我的意思是说,
容器技术,尤其是singularity 这种,
也有可能继承你在主机的某些设定。

如果你能保持你的主机运行环境干净,
那么,镜像中的东西,
只核内核打交道了,
会无视你的设定的,除非你在主机上做了某些非常牛逼的全局性的设定。

系统配置丰富多样,
我并不晓得你做过什么设定。

从你的描述来看,他人做的镜像没问题,
你做的没法用,
这不难推定,你的系统部分设定可能有问题,
或者你在搞SIF的时候,有部分操作配置不当。

因为,单机都跑不起来,其实和集群没有关系的。

你说的bug,我见别人描述一次,
那边重做了一下系统,又全都正常了。具体故障原因不明,反正是解决了。

喊我abin 就好。

能力有限,有愧老师这个称谓。

作者
Author:
xylz6188    时间: 2022-10-9 21:31
MS安装系统用红帽最好,其它版本我都用过,不是编译出问题就是计算结果大大的出乎意料
作者
Author:
wuy069    时间: 2022-10-10 14:11
xylz6188 发表于 2022-10-9 21:31
MS安装系统用红帽最好,其它版本我都用过,不是编译出问题就是计算结果大大的出乎意料

已解决,谢谢!这个主要是MS自带intel mpi 2018/2019在高版本系统的问题.
用singularity容器可以解决,但是限于RHEL/CentOS/Rocky Linux 8.5及以下版本,用Rocky Linux 8.6在实体机总有问题,我把计算节点系统版本都降为8.5都好了。
作者
Author:
alexpanji    时间: 2022-10-15 16:14
您好,最近尝试集群下MS2020的安装,用slurm管理,请问是否可以提供一个教程,谢谢~
作者
Author:
wuy069    时间: 2022-10-19 22:41
alexpanji 发表于 2022-10-15 16:14
您好,最近尝试集群下MS2020的安装,用slurm管理,请问是否可以提供一个教程,谢谢~

正常管理就行,也不需要啥教程,我们使用standlone方式运行MaterialsStudio,所以跟Gaussian这些软件管理一样




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3