计算化学公社

 找回密码 Forget password
 注册 Register
Views: 14837|回复 Reply: 30
打印 Print 上一主题 Last thread 下一主题 Next thread

[CASTEP/Dmol3/MS] MS for Linux CASTEP模块怎样实现两个节点并行计算呢?是需要修改安装路径下的吗?

[复制链接 Copy URL]

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 如遇古剑 于 2021-12-20 14:50 编辑

大家好!我想请教大家一个问题,还请大家指点一下,不胜感激!
是这样的:我向服务器上面安装的MS提交一个计算任务,一个节点计算不了,想用两个节点计算,我在PBS脚本里面写的代码是:#PBS -l nodes=2:ppn=48或者是#PBS -l nodes=node5:ppn=48+node6:ppn=48。这样写代码不会报错,出现的问题是节点5可以load 48个核,而node 6一直都是load 0,这是为什么呢?需要怎样设置才可以实现CASTEP的并行计算呢?是不是需要修改安装路径下的某个文件呢?


8

帖子

0

威望

77

eV
积分
85

Level 2 能力者

31#
发表于 Post on 2023-9-30 09:45:09 | 只看该作者 Only view this author
小张要努力 发表于 2023-9-25 21:28
楼主,能求一份MS的运行脚本吗?救救孩子吧!我的邮箱.楼里的脚本我用着有问题

#!/bin/sh -f
#PBS -N job
#PBS -q batch
#PBS -l nodes=1:ppn=24  
#PBS -l walltime=480:00:00
#PBS -j oe
#PBS -V

#上面这些信息根据自己情况改

cd $PBS_O_WORKDIR

seedname="fe100"  #引号里面的是文件名
#cat $PBS_NODEFILE  > machines.LINUX
#export DSD_MachineList=$PBS_O_WORKDIR/machines.LINUX
export DSD_NumProc=24

/home/zxj/BIOVIA/MaterialsStudio19.1/etc/CASTEP/bin/RunCASTEP.sh -np $DSD_NumProc $seedname  #这个需要改一下路径就行

#其他的不需要改
这个是到网上找到了,可以提交,给大家一个参考

8

帖子

0

威望

77

eV
积分
85

Level 2 能力者

30#
发表于 Post on 2023-9-25 21:28:42 | 只看该作者 Only view this author
楼主,能求一份MS的运行脚本吗?救救孩子吧!我的邮箱1160171521@qq.com.楼里的脚本我用着有问题

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

29#
发表于 Post on 2023-8-19 15:59:09 | 只看该作者 Only view this author
pwzhou 发表于 2023-8-19 15:15
指定了也是单核运行的,其他几个核都空着浪费了,程序没有实现的是功能和你提交作业的方式是没有关系的。

好的 谢谢

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

28#
发表于 Post on 2023-8-19 15:15:19 | 只看该作者 Only view this author
ldx022 发表于 2023-8-19 14:04
但是如果再电脑window下面直接run的话,是可以指定核数的

指定了也是单核运行的,其他几个核都空着浪费了,程序没有实现的是功能和你提交作业的方式是没有关系的。

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

27#
发表于 Post on 2023-8-19 14:04:42 | 只看该作者 Only view this author
pwzhou 发表于 2023-8-19 13:50
这个是没有办法的,本身程序不支持二阶导数的并行,那就只能用串行了。

但是如果再电脑window下面直接run的话,是可以指定核数的

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

26#
发表于 Post on 2023-8-19 13:50:42 | 只看该作者 Only view this author
ldx022 发表于 2023-8-18 22:57
朋友你好,模仿你的方式运行GULP.exe,但是不管怎么回事gout文件总是会报错:

!!!!!!!!!!!!!!!!!!!!!! ...

我没用过GULP

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

25#
发表于 Post on 2023-8-19 13:50:15 | 只看该作者 Only view this author
ldx022 发表于 2023-8-18 19:56
请问老师,初次用MS在linux下面交作业,想在linux上在LSF作业集群上运行GULP,如果用多个核并行会出现报 ...

这个是没有办法的,本身程序不支持二阶导数的并行,那就只能用串行了。

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

24#
发表于 Post on 2023-8-18 22:57:53 | 只看该作者 Only view this author
pwzhou 发表于 2020-8-10 09:56
RunCASTEP.sh是MS自带的脚本,会调用很多东西,我给你的脚本就是直接绕过这个脚本,用mpirun运行,使用ma ...

朋友你好,模仿你的方式运行GULP.exe,但是不管怎么回事gout文件总是会报错:

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!! ERROR : could not open library file = catlow                                                                          
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!


Program terminated by processor     0 in          setlib

我交作业的脚本关于一些变量的设置如下:
  1. export MS_INSTALL_ROOT=/share/apps/Accelrys/MaterialsStudio8.0
  2. export MPIRUN=$MS_INSTALL_ROOT/bin/mpirun
  3. export GULP=$MS_INSTALL_ROOT/bin/gulp.exe
  4. export I_MPI_ROOT=$MS_INSTALL_ROOT
  5. export PATH=$MS_INSTALL_ROOT/bin:$PATH
  6. #export PATH=$MS_INSTALL_ROOT/bin:$PATH:$MS_INSTALL_ROOT/etc/GULP/bin:$MS_INSTALL_ROOT/share/bin
  7. export LD_LIBRARY_PATH=$MS_INSTALL_ROOT/lib:$LD_LIBRARY_PATH
  8. export MSI_LIC_PACK_DIR=/share/apps/Accelrys/LicensePack
  9. export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$MSI_LIC_PACK_DIR/linux/lib
  10. export LD_LIBRARY_PATH=$MS_INSTALL_ROOT/share/Resources/Nanotech/GULP:$LD_LIBRARY_PATH
  11. export LIBRARY_PATH=$MS_INSTALL_ROOT/share/Resources/Nanotech/GULP:$LIBRARY_PATH
  12. #export PSPOT_DIR=$MS_INSTALL_ROOT/share/Resources/Quantum/Castep/Potentials
  13. export PSPOT_DIR=$MS_INSTALL_ROOT/share/Resources/Nanotech/GULP
  14. #export GULP_LIBRARY_PATH=/share/apps/Accelrys/MaterialsStudio8.0/share/Resources/

  15. #力场的目录/share/apps/Accelrys/MaterialsStudio8.0/share/Resources/Nanotech/GULP
复制代码


执行的命令是:$MPIRUN -machinefile hosts.txt -np $NPROCS $GULP ${INPUT_FILE}

试了很多方式都以失败告终,望大佬解答!感激不尽

16

帖子

0

威望

161

eV
积分
177

Level 3 能力者

23#
发表于 Post on 2023-8-18 19:56:18 | 只看该作者 Only view this author
pwzhou 发表于 2020-8-10 10:00
环境变量大同小异,这个是18.1版本的环境变量,根据实际情况改一下即可。

请问老师,初次用MS在linux下面交作业,想在linux上在LSF作业集群上运行GULP,如果用多个核并行会出现报错:!! ERROR : second derivatives unavailable in parallel,只能用1个核,请问这个要怎么解决呢?我看老师您的帖子里是直接使用的castepexe.exe可执行文件来绕过RunCASTEP.sh脚本,但是对于GULP来讲并没有GULP这个exe文件,请问这种情况下应该怎么办呢?

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

22#
 楼主 Author| 发表于 Post on 2020-9-15 01:06:04 | 只看该作者 Only view this author
本帖最后由 如遇古剑 于 2021-12-20 14:54 编辑
pwzhou 发表于 2020-9-14 20:33
在mpirun的后面加入如下参数:
-env I_MPI_FABRICS tcp

谢谢老师!

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

21#
 楼主 Author| 发表于 Post on 2020-9-14 20:58:05 | 只看该作者 Only view this author
本帖最后由 如遇古剑 于 2021-12-20 14:48 编辑
pwzhou 发表于 2020-9-14 20:33
在mpirun的后面加入如下参数:
-env I_MPI_FABRICS tcp

非常感谢老师的指点,非常感谢!
我不是为了计算快,主要是因为计算量太大了,一个节点计算不了。非常感谢老师!冒昧再向老师请教一下,就是我安装的MS不生成.check文件是哪里的设置问题呢?

361

帖子

0

威望

4232

eV
积分
4593

Level 6 (一方通行)

20#
发表于 Post on 2020-9-14 20:33:54 | 只看该作者 Only view this author
如遇古剑 发表于 2020-9-14 20:26
感谢老师的回复,我们这个服务器没有IB交换机,是通过千兆网进行通信的,这种情况请改怎么弄呢?

在mpirun的后面加入如下参数:
-env I_MPI_FABRICS tcp

没有IB卡跨节点计算未必会比单节点快

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

19#
 楼主 Author| 发表于 Post on 2020-9-14 20:28:08 | 只看该作者 Only view this author
abin 发表于 2020-9-14 19:42
MPI驱动相关问题。

你用的MPI认为,它找到了IB卡。

感谢老师的回复,我们的服务器没有IB卡,应该修改哪个文件呢?

38

帖子

0

威望

308

eV
积分
346

Level 3 能力者

18#
 楼主 Author| 发表于 Post on 2020-9-14 20:26:40 | 只看该作者 Only view this author
pwzhou 发表于 2020-9-14 20:00
跨节点并行默认调用IB卡,你这个机器是不是没有Infiniband网络?

感谢老师的回复,我们这个服务器没有IB交换机,是通过千兆网进行通信的,这种情况请改怎么弄呢?

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-26 05:25 , Processed in 0.182145 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list