计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: 如遇古剑
打印 Print 上一主题 Last thread 下一主题 Next thread

[CASTEP/Dmol3/MS] MS for Linux CASTEP模块怎样实现两个节点并行计算呢?是需要修改安装路径下的吗?

[复制链接 Copy URL]

2301

帖子

1

威望

5477

eV
积分
7798

Level 6 (一方通行)

16#
发表于 Post on 2020-9-14 19:42:47 | 只看该作者 Only view this author
如遇古剑 发表于 2020-9-14 19:08
老师,您好!请问一下MS跨节点运行出现以下报错怎么解决啊?用的脚本是老师您给的,我修改了一下路径。望 ...

MPI驱动相关问题。

你用的MPI认为,它找到了IB卡。
系统有IB卡吗?
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

17#
发表于 Post on 2020-9-14 20:00:25 | 只看该作者 Only view this author
如遇古剑 发表于 2020-9-14 19:08
老师,您好!请问一下MS跨节点运行出现以下报错怎么解决啊?用的脚本是老师您给的,我修改了一下路径。望 ...

跨节点并行默认调用IB卡,你这个机器是不是没有Infiniband网络?

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

18#
 楼主 Author| 发表于 Post on 2020-9-14 20:26:40 | 只看该作者 Only view this author
pwzhou 发表于 2020-9-14 20:00
跨节点并行默认调用IB卡,你这个机器是不是没有Infiniband网络?

感谢老师的回复,我们这个服务器没有IB交换机,是通过千兆网进行通信的,这种情况请改怎么弄呢?

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

19#
 楼主 Author| 发表于 Post on 2020-9-14 20:28:08 | 只看该作者 Only view this author
abin 发表于 2020-9-14 19:42
MPI驱动相关问题。

你用的MPI认为,它找到了IB卡。

感谢老师的回复,我们的服务器没有IB卡,应该修改哪个文件呢?

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

20#
发表于 Post on 2020-9-14 20:33:54 | 只看该作者 Only view this author
如遇古剑 发表于 2020-9-14 20:26
感谢老师的回复,我们这个服务器没有IB交换机,是通过千兆网进行通信的,这种情况请改怎么弄呢?

在mpirun的后面加入如下参数:
-env I_MPI_FABRICS tcp

没有IB卡跨节点计算未必会比单节点快

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

21#
 楼主 Author| 发表于 Post on 2020-9-14 20:58:05 | 只看该作者 Only view this author
本帖最后由 如遇古剑 于 2021-12-20 14:48 编辑
pwzhou 发表于 2020-9-14 20:33
在mpirun的后面加入如下参数:
-env I_MPI_FABRICS tcp

非常感谢老师的指点,非常感谢!
我不是为了计算快,主要是因为计算量太大了,一个节点计算不了。非常感谢老师!冒昧再向老师请教一下,就是我安装的MS不生成.check文件是哪里的设置问题呢?

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

22#
 楼主 Author| 发表于 Post on 2020-9-15 01:06:04 | 只看该作者 Only view this author
本帖最后由 如遇古剑 于 2021-12-20 14:54 编辑
pwzhou 发表于 2020-9-14 20:33
在mpirun的后面加入如下参数:
-env I_MPI_FABRICS tcp

谢谢老师!

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

23#
发表于 Post on 2023-8-18 19:56:18 | 只看该作者 Only view this author
pwzhou 发表于 2020-8-10 10:00
环境变量大同小异,这个是18.1版本的环境变量,根据实际情况改一下即可。

请问老师,初次用MS在linux下面交作业,想在linux上在LSF作业集群上运行GULP,如果用多个核并行会出现报错:!! ERROR : second derivatives unavailable in parallel,只能用1个核,请问这个要怎么解决呢?我看老师您的帖子里是直接使用的castepexe.exe可执行文件来绕过RunCASTEP.sh脚本,但是对于GULP来讲并没有GULP这个exe文件,请问这种情况下应该怎么办呢?

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

24#
发表于 Post on 2023-8-18 22:57:53 | 只看该作者 Only view this author
pwzhou 发表于 2020-8-10 09:56
RunCASTEP.sh是MS自带的脚本,会调用很多东西,我给你的脚本就是直接绕过这个脚本,用mpirun运行,使用ma ...

朋友你好,模仿你的方式运行GULP.exe,但是不管怎么回事gout文件总是会报错:

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!! ERROR : could not open library file = catlow                                                                          
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!


Program terminated by processor     0 in          setlib

我交作业的脚本关于一些变量的设置如下:
  1. export MS_INSTALL_ROOT=/share/apps/Accelrys/MaterialsStudio8.0
  2. export MPIRUN=$MS_INSTALL_ROOT/bin/mpirun
  3. export GULP=$MS_INSTALL_ROOT/bin/gulp.exe
  4. export I_MPI_ROOT=$MS_INSTALL_ROOT
  5. export PATH=$MS_INSTALL_ROOT/bin:$PATH
  6. #export PATH=$MS_INSTALL_ROOT/bin:$PATH:$MS_INSTALL_ROOT/etc/GULP/bin:$MS_INSTALL_ROOT/share/bin
  7. export LD_LIBRARY_PATH=$MS_INSTALL_ROOT/lib:$LD_LIBRARY_PATH
  8. export MSI_LIC_PACK_DIR=/share/apps/Accelrys/LicensePack
  9. export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$MSI_LIC_PACK_DIR/linux/lib
  10. export LD_LIBRARY_PATH=$MS_INSTALL_ROOT/share/Resources/Nanotech/GULP:$LD_LIBRARY_PATH
  11. export LIBRARY_PATH=$MS_INSTALL_ROOT/share/Resources/Nanotech/GULP:$LIBRARY_PATH
  12. #export PSPOT_DIR=$MS_INSTALL_ROOT/share/Resources/Quantum/Castep/Potentials
  13. export PSPOT_DIR=$MS_INSTALL_ROOT/share/Resources/Nanotech/GULP
  14. #export GULP_LIBRARY_PATH=/share/apps/Accelrys/MaterialsStudio8.0/share/Resources/

  15. #力场的目录/share/apps/Accelrys/MaterialsStudio8.0/share/Resources/Nanotech/GULP
复制代码


执行的命令是:$MPIRUN -machinefile hosts.txt -np $NPROCS $GULP ${INPUT_FILE}

试了很多方式都以失败告终,望大佬解答!感激不尽

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

25#
发表于 Post on 2023-8-19 13:50:15 | 只看该作者 Only view this author
ldx022 发表于 2023-8-18 19:56
请问老师,初次用MS在linux下面交作业,想在linux上在LSF作业集群上运行GULP,如果用多个核并行会出现报 ...

这个是没有办法的,本身程序不支持二阶导数的并行,那就只能用串行了。

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

26#
发表于 Post on 2023-8-19 13:50:42 | 只看该作者 Only view this author
ldx022 发表于 2023-8-18 22:57
朋友你好,模仿你的方式运行GULP.exe,但是不管怎么回事gout文件总是会报错:

!!!!!!!!!!!!!!!!!!!!!! ...

我没用过GULP

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

27#
发表于 Post on 2023-8-19 14:04:42 | 只看该作者 Only view this author
pwzhou 发表于 2023-8-19 13:50
这个是没有办法的,本身程序不支持二阶导数的并行,那就只能用串行了。

但是如果再电脑window下面直接run的话,是可以指定核数的

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

28#
发表于 Post on 2023-8-19 15:15:19 | 只看该作者 Only view this author
ldx022 发表于 2023-8-19 14:04
但是如果再电脑window下面直接run的话,是可以指定核数的

指定了也是单核运行的,其他几个核都空着浪费了,程序没有实现的是功能和你提交作业的方式是没有关系的。

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

29#
发表于 Post on 2023-8-19 15:59:09 | 只看该作者 Only view this author
pwzhou 发表于 2023-8-19 15:15
指定了也是单核运行的,其他几个核都空着浪费了,程序没有实现的是功能和你提交作业的方式是没有关系的。

好的 谢谢

8

帖子

0

威望

77

eV
积分
85

Level 2 能力者

30#
发表于 Post on 2023-9-25 21:28:42 | 只看该作者 Only view this author
楼主,能求一份MS的运行脚本吗?救救孩子吧!我的邮箱1160171521@qq.com.楼里的脚本我用着有问题

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-26 06:03 , Processed in 0.165356 second(s), 19 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list