计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: 冰释之川
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] CentOS下安装PBS+maui教程

  [复制链接 Copy URL]

1102

帖子

18

威望

6643

eV
积分
8105

Level 6 (一方通行)

計算化学の社畜

16#
 楼主 Author| 发表于 Post on 2021-3-8 08:37:18 | 只看该作者 Only view this author
Y30181009 发表于 2021-3-7 20:57
老师,如果进行单机安装,可以按照博文来吗?

可以, 计算节点的安装配置直接跳过即可
Stand on the shoulders of giants

16

帖子

0

威望

2694

eV
积分
2710

Level 5 (御坂)

17#
发表于 Post on 2021-3-8 08:55:36 | 只看该作者 Only view this author
冰释之川 发表于 2021-3-8 08:37
可以, 计算节点的安装配置直接跳过即可

谢谢老师

195

帖子

0

威望

4029

eV
积分
4224

Level 6 (一方通行)

18#
发表于 Post on 2021-3-18 21:01:35 | 只看该作者 Only view this author
老师请问PBS脚本设置了CPU和内存参数,但是提交任务时Gaussian无法识别是怎么回事?Gaussian只能识别安装目录Default.Route里面的参数,是我哪里写错了吗?
我采用的单机安装,脚本内容如下:
#PBS -N Gaussian
#PBS -o job.log
#PBS -e err.log
#PBS -l nodes=1:ppn=12
#PBS -l mem=24000mb
#PBS -q normal
#PBS -j oe
cd $PBS_O_WORKDIR

INPUT_NAME=zn-td      

g09 $INPUT_NAME.gjf
wait
formchk $INPUT_NAME.chk

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

19#
发表于 Post on 2021-3-18 21:20:22 | 只看该作者 Only view this author
tiandikuoyuan 发表于 2021-3-18 21:01
老师请问PBS脚本设置了CPU和内存参数,但是提交任务时Gaussian无法识别是怎么回事?Gaussian只能识别安装目 ...

1.  干掉 Default.Route里面的参数或者Default.Route配置.
2.  PBS脚本中指定内存和ppn数目
3.  input文件中指定%CPU %MEM
4.  如果不想手动指定input文件, 可以让脚本代劳. sed等修改输入文件即可.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

195

帖子

0

威望

4029

eV
积分
4224

Level 6 (一方通行)

20#
发表于 Post on 2021-3-18 21:38:39 | 只看该作者 Only view this author
abin 发表于 2021-3-18 21:20
1.  干掉 Default.Route里面的参数或者Default.Route配置.
2.  PBS脚本中指定内存和ppn数目
3.  input ...

PBS脚本指定了内存和核心数,不清楚为什么Gaussian不识别;Default.Route不设置的话,Gaussian只能单核运行

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

21#
发表于 Post on 2021-3-18 22:24:50 | 只看该作者 Only view this author
tiandikuoyuan 发表于 2021-3-18 21:38
PBS脚本指定了内存和核心数,不清楚为什么Gaussian不识别;Default.Route不设置的话,Gaussian只能单核运 ...

你能否按照我说的试试?

你可以仔细读读高斯手册中, 关于使用Default.Route的前提.
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

7

帖子

0

威望

53

eV
积分
60

Level 2 能力者

22#
发表于 Post on 2021-3-19 11:29:43 | 只看该作者 Only view this author
喵星大佬 发表于 2020-12-22 21:03
在centos中安装用apt-get嘛

haiyou henduo sudo

251

帖子

4

威望

4400

eV
积分
4731

Level 6 (一方通行)

23#
发表于 Post on 2021-6-9 20:28:48 | 只看该作者 Only view this author
请教一下:我用虚拟机模拟了master和slave01两个节点(每个节点给两个物理核心),安装上了PBS,且
  1. echo sleep 7 | qsub
复制代码

测试通过。

重启两个节点后再次测试echo sleep 7 | qsub依然成功。


不过发现运行
  1. for i in pbs_server pbs_sched pbs_mom trqauthd; do sudo service $i restart;done
复制代码
不再是4个OK了,而是
Restarting pbs_server (via systemctl):                     [  OK  ]
Restarting pbs_sched (via systemctl):  Job for pbs_sched.service failed because the control process exited with error code. See "systemctl status pbs_sched.service" and "journalctl -xe" for details.
                                                           [FAILED]
Restarting pbs_mom (via systemctl):                        [  OK  ]
Restarting trqauthd (via systemctl):                       [  OK  ]

请问一下这有问题吗?我后面又重装了几次系统和PBS,发现在这个操作之前
最后重启主节点,运行showq命令查看是否正常。

返回的都是四个OK,只要reboot主节点了就会出现一个FAILED

1102

帖子

18

威望

6643

eV
积分
8105

Level 6 (一方通行)

計算化学の社畜

24#
 楼主 Author| 发表于 Post on 2021-6-11 12:30:44 | 只看该作者 Only view this author
本帖最后由 冰释之川 于 2021-6-11 12:38 编辑
djjj148 发表于 2021-6-9 20:28
请教一下:我用虚拟机模拟了master和slave01两个节点(每个节点给两个物理核心),安装上了PBS,且
测试通过 ...

按照这个流程走之后,pbs_sched 默认是关闭的(因为使用maui管理提交任务),你让pbs_sched开机不要自启动就行了。
另外如果不影响任务提交与分配,可以无视之

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
djjj148 + 5 非常感谢!

查看全部评分 View all ratings

Stand on the shoulders of giants

538

帖子

2

威望

2476

eV
积分
3054

Level 5 (御坂)

25#
发表于 Post on 2021-6-11 13:18:25 | 只看该作者 Only view this author
冰释之川 发表于 2021-6-11 12:30
按照这个流程走之后,pbs_sched 默认是关闭的(因为使用maui管理提交任务),你让pbs_sched开机不要自启 ...

老师,您好,我的系统是centos 7.8  之前用的是turque6.1.2 升级了gcc(4.8.5到8.3.0 后) 就出现了问题“”“ cannot connect to server master (errno=111) Connection refused”

请问还可以根据您的帖子安装吗?

1102

帖子

18

威望

6643

eV
积分
8105

Level 6 (一方通行)

計算化学の社畜

26#
 楼主 Author| 发表于 Post on 2021-6-11 16:01:28 | 只看该作者 Only view this author
风飞 发表于 2021-6-11 13:18
老师,您好,我的系统是centos 7.8  之前用的是turque6.1.2 升级了gcc(4.8.5到8.3.0 后) 就出现了问题“ ...

just try ~
Stand on the shoulders of giants

9

帖子

0

威望

416

eV
积分
425

Level 3 能力者

27#
发表于 Post on 2021-7-17 09:57:41 | 只看该作者 Only view this author
感谢分享,这个教程太实用了!受益匪浅!

1102

帖子

18

威望

6643

eV
积分
8105

Level 6 (一方通行)

計算化学の社畜

28#
 楼主 Author| 发表于 Post on 2021-7-17 21:14:07 | 只看该作者 Only view this author
2021/07/17更新:附上快速进入PBS作业目录的脚本
Stand on the shoulders of giants

251

帖子

4

威望

4400

eV
积分
4731

Level 6 (一方通行)

29#
发表于 Post on 2021-7-20 21:15:11 | 只看该作者 Only view this author
本帖最后由 djjj148 于 2021-7-20 22:06 编辑

请教一下,严格用这个方法安装集群后,提交任务一直到结束后都不会生成标准输出和错误输出文件,具体是:只有登录节点开机才会生成这两个文件。
一旦计算节点开机就不会生成。
甚至我在提交脚本里写了#PBS -e example.stderr都没用。
我用的其他PBS集群都会有生成,比如g16.o1和g16.e1,其中g16是任务名,1是JOBID。请问是还需要一些设置才可以的吗?

1102

帖子

18

威望

6643

eV
积分
8105

Level 6 (一方通行)

計算化学の社畜

30#
 楼主 Author| 发表于 Post on 2021-7-21 08:20:16 | 只看该作者 Only view this author
djjj148 发表于 2021-7-20 21:15
请教一下,严格用这个方法安装集群后,提交任务一直到结束后都不会生成标准输出和错误输出文件,具体是:只 ...

标准输出和标准错误文件产生于当前工作目录,我这边没问题:

  1. #!/bin/bash
  2. #PBS -N Gaussian
  3. #PBS -l nodes=1:ppn=16
  4. #PBS -l walltime=1440:00:00
  5. #PBS -q AMD
  6. #PBS -o jobID.$PBS_JOBID

  7. # mkdir -p ~/tmp/$PBS_JOBID
  8. # scp -r master:$PBS_O_WORKDIR/* ~/tmp/$PBS_JOBID
  9. # cd ~/tmp/$PBS_JOBID

  10. cd $PBS_O_WORKDIR
  11. touch jobID.$PBS_JOBID

  12. FILENAME=6PPD_Hc.gjf   # input file name

  13. g16 $FILENAME   # running gaussian 16
  14. wait
  15. formchk ${FILENAME/%gjf/chk}
  16. wait
  17. rm ${FILENAME/%gjf/chk}

  18. # scp -r ~/tmp/$PBS_JOBID/* master:$PBS_O_WORKDIR
  19. # rm -rf ~/tmp/$PBS_JOBID
复制代码
Stand on the shoulders of giants

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 12:17 , Processed in 0.207838 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list