计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4586|回复 Reply: 14
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] 如何实现多个节点均可使用同款软件?

[复制链接 Copy URL]

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
有这么个问题请教大家:有款软件A只能在节点1上使用?如何设置才能让其在多个节点上均能使用?

系统是CentOS 6.5,作业调度系统是Torque + Maui

161

帖子

0

威望

2635

eV
积分
2796

Level 5 (御坂)

2#
发表于 Post on 2017-6-27 17:04:58 | 只看该作者 Only view this author
指定一个管理节点还有就是软件装存储上,其他节点调用。

50

帖子

0

威望

1491

eV
积分
1542

Level 5 (御坂)

3#
发表于 Post on 2017-6-27 17:54:48 | 只看该作者 Only view this author
nfs 网络共享

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2017-6-27 17:58:47 | 只看该作者 Only view this author
alwens 发表于 2017-6-27 17:04
指定一个管理节点还有就是软件装存储上,其他节点调用。

管理节点已指定,软件也是装在存储上的,用其他软件没有问题,就只有一款软件只能在一个节点用,感觉是被限制了,但不知道到从什么地方能改?是跟群组有关还是跟Torque、Maui的调度有关?

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

5#
 楼主 Author| 发表于 Post on 2017-6-27 17:59:45 | 只看该作者 Only view this author

嗯,是共享的。但不确定是不是哪个地方被限制了,所以只有这款软件不能多节点共享。

264

帖子

0

威望

2588

eV
积分
2852

Level 5 (御坂)

6#
发表于 Post on 2017-6-27 18:49:26 | 只看该作者 Only view this author
不能共享时错误代码?
想起当年某电脑机房,一台机子开了大富翁4,其它电脑就玩不了这个游戏了。
然后老板和我们都很苦恼,弱弱地直到高中毕业也没解决。。。

361

帖子

0

威望

4226

eV
积分
4587

Level 6 (一方通行)

7#
发表于 Post on 2017-6-28 08:29:16 | 只看该作者 Only view this author
具体说明是哪款软件?在别的机器上运行报什么错误?
你这样问太笼统了,这是让大家猜谜语呢。
我提供一种可能:有的软件的license是和网卡绑定的,如果只绑定了那台机器的网卡,那就只能在那台机器上用,要想在别的节点用,那就把别的节点的信息加进去,当然很多时候这个是需要交钱的。

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2017-6-28 14:25:14 | 只看该作者 Only view this author
本帖最后由 xiaowandouer 于 2017-6-28 14:27 编辑
pwzhou 发表于 2017-6-28 08:29
具体说明是哪款软件?在别的机器上运行报什么错误?
你这样问太笼统了,这是让大家猜谜语呢。
我提供一种 ...

抱歉,没有说清楚。是Material Studio 6,破解版。在任何一个节点提交任务都只提交到那台固定的节点上,高斯什么的就没有问题。高斯,MS都是装在同一个目录下共享出去的。
如果还需要提供任何信息,请告知。

361

帖子

0

威望

4226

eV
积分
4587

Level 6 (一方通行)

9#
发表于 Post on 2017-6-28 16:39:39 | 只看该作者 Only view this author
xiaowandouer 发表于 2017-6-28 14:25
抱歉,没有说清楚。是Material Studio 6,破解版。在任何一个节点提交任务都只提交到那台固定的节点上, ...

这个应该是在安装目录下的MaterialsStudio6.0/share/data下的machines.LINUX文件中只写了那个固定节点的名称导致的,你们是怎么提交作业的?如果用的PBS脚本的话应该不受这个文件影响才对,说一下你们提交作业的方式,然后告诉你怎么改这个文件

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

10#
 楼主 Author| 发表于 Post on 2017-6-28 17:59:15 | 只看该作者 Only view this author
pwzhou 发表于 2017-6-28 16:39
这个应该是在安装目录下的MaterialsStudio6.0/share/data下的machines.LINUX文件中只写了那个固定节点的 ...

谢谢您的热心回复!

看了你说的这个文件,所有节点都写进去了。

交作业, 目前我只用过最笨的方法,就是RunCASTEP.sh

361

帖子

0

威望

4226

eV
积分
4587

Level 6 (一方通行)

11#
发表于 Post on 2017-6-29 08:14:59 | 只看该作者 Only view this author
xiaowandouer 发表于 2017-6-28 17:59
谢谢您的热心回复!

看了你说的这个文件,所有节点都写进去了。

问题解决了就行。

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

12#
 楼主 Author| 发表于 Post on 2017-6-29 09:56:22 | 只看该作者 Only view this author
pwzhou 发表于 2017-6-29 08:14
问题解决了就行。

问题没解决,最开始,所有节点就已经写进machines.LINUX中了

不知道问题到底出在什么地方

361

帖子

0

威望

4226

eV
积分
4587

Level 6 (一方通行)

13#
发表于 Post on 2017-6-30 10:13:53 | 只看该作者 Only view this author
xiaowandouer 发表于 2017-6-29 09:56
问题没解决,最开始,所有节点就已经写进machines.LINUX中了

不知道问题到底出在什么地方

晕,迷糊了,你们有Torque吗?提交作业的具体命令看看,不行就把那个文件改成localhost,不要写任何节点的信息。

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

14#
 楼主 Author| 发表于 Post on 2017-7-3 16:21:58 | 只看该作者 Only view this author
本帖最后由 xiaowandouer 于 2017-7-3 16:30 编辑
pwzhou 发表于 2017-6-30 10:13
晕,迷糊了,你们有Torque吗?提交作业的具体命令看看,不行就把那个文件改成localhost,不要写任何节点 ...

用脚本文件试了下,依然报错:
mpiexec: unable to start all procs; may have invalid machine names
    remaining specified hosts:
        IP地址 (node1)

脚本内容如下:
#PBS -N castep
#PBS -l nodes=1:ppn=8
#PBS -m abe
#PBS -j oe
#PBS -l walltime=200:00:00
cd $PBS_O_WORKDIR
RunCASTEP.sh -np 8 3-top

109

帖子

0

威望

999

eV
积分
1108

Level 4 (黑子)

15#
 楼主 Author| 发表于 Post on 2017-7-3 16:38:37 | 只看该作者 Only view this author
xiaowandouer 发表于 2017-7-3 16:21
用脚本文件试了下,依然报错:
mpiexec: unable to start all procs; may have invalid machine names
...

重点似乎在这句“may have invalid machine names”
看了etc/hosts的内容,看起来都正常啊
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
xxx.xx.xx.10    master
xxx.xx.xx.11    node1
xxx.xx.xx.12    node2
xxx.xx.xx.13    node3
xxx.xx.xx.14    node4
xxx.xx.xx.15    node5
xxx.xx.xx.16    node6
xxx.xx.xx.17    node7
xxx.xx.xx.18    node8
xxx.xx.xx.19    node9
xxx.xx.xx.20    node10
xxx.xx.xx.21    node11
xxx.xx.xx.22    node12

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:16 , Processed in 0.192162 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list