计算化学公社

 找回密码 Forget password
 注册 Register
Views: 6038|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[集群维护] windows下用ssh连接到服务器

[复制链接 Copy URL]

198

帖子

0

威望

2241

eV
积分
2439

Level 5 (御坂)

各位老师,
       我有几个服务器的问题想请教一下,我先简单描述下我的服务器:
       我这里总共有两台刀片式服务器,HP 460C的,还有浪潮的(型号不太清楚),公用同一个节点。HP的比较老了,昨天换了硬盘,重新装了系统。现在的问题是,用ssh链接,换了系统的四个刀片的状态显示的是down(命令是pbsnodes -l),高斯、MS等软件是安装在节点上的。
      我的问题是:
      1. 软件安装在节点上的话,计算时硬盘容量大小要看节点的,cup使服务器的,我的理解对么?
      2. 现在显示down的状态,我该怎么解决?
      谢谢各位老师,祝各位老师新年快乐!
站在宇宙中心呼唤爱

77

帖子

0

威望

2592

eV
积分
2669

Level 5 (御坂)

2#
发表于 Post on 2017-1-2 16:16:59 | 只看该作者 Only view this author
1. 这个和你的集群的架构有关,一般计算集群中的计算节点都要挂载一个和管理节点共用的共享存储(如通过Lustre、GFPS等并行文件系统或通过NFS挂载一个共享分区等方式)。通常计算软件都会安在共享存储区里,不清楚你说的“安装在节点上”是在节点的共享存储还是在计算节点本地。计算时硬盘使用要看你用的软件指定了哪里去存放中间临时文件(如Gaussian中GAUSS_SCRDIR变量的设置)。如果你指定计算节点的本地目录存放,容量就看计算节点的;如果指定了共享存储区,容量就看共享区的。CPU都是使用运行作业的那个计算节点的。

2.
(1)首先检查一下网络连接。从管理节点去ping一下你down状态的节点看看是否可以ping通,确保网络配置正确。
(2)检查作业调度系统是否安装配置正确,你的调度系统应该是torque吧?确保管理节点和计算节点torque的配置都正确。

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
sobereva + 1

查看全部评分 View all ratings

198

帖子

0

威望

2241

eV
积分
2439

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2017-1-2 22:54:22 | 只看该作者 Only view this author
winterzen 发表于 2017-1-2 16:16
1. 这个和你的集群的架构有关,一般计算集群中的计算节点都要挂载一个和管理节点共用的共享存储(如通过Lus ...

谢谢您的回答,还有几个问题想请教您:
1. 我是通过pbs文件和qusb命令提交gaussian作业的,应该就是您说的torque吧。我的安装文件下没有找到GAUSS_SCRDIR这个文件,但是我的pbs文件里有设置,应该是临时变量:
g09root=/opt/software/gaussian
export GAUSS_EXEDIR=$g09root/g09
export GAUSS_SCRDIR=/tmp/
export PATH=$PATH:$g09root/g09/
source $g09root/g09/bsd/g09.profile
这里的意思是临时文件存储在tmp这个文件夹里吧,这个文件夹在什么地方呢?我找了半天没找到。
2. 我也不清楚我的软件安装在哪里,我怎么判断呢?
3. CPU用的是计算节点的话,我的服务器刀片配置就没什么意义了吧。
4. 我请工程师来维修了一下,他说我原来的刀片上安装了PBS客户端,但是他现在找不到我的安装文件,所以没敢动。浪潮的机器买的晚,当时可能是为了节省经费吧,结果浪潮的服务器直接用了HP的节点,所以现在需要原来安装浪潮是的pbs客户端。我不太理解,这个pbs客户端不是应该随便都可以么,必须要一样么?或者浪潮有专门的pbs客户端是我们一般人拿不到的么?
站在宇宙中心呼唤爱

77

帖子

0

威望

2592

eV
积分
2669

Level 5 (御坂)

4#
发表于 Post on 2017-1-2 23:24:47 | 只看该作者 Only view this author
1. 是的,你计算Gaussian作业的临时文件会存在/tmp里,在你的计算节点上,根目录下的/tmp
2. 你的Gaussian安装在/opt/software/gaussian目录下,你从计算节点上看看/opt/software目录是本地目录还是网络挂载的,执行df命令,看看有没有网络挂载点指向/opt或/opt/software。如果没有就是本地目录。
3. "服务器刀片"是指你的管理节点吗?作业计算速率取决于计算节点的配置,和管理节点关系不大。管理节点主要负责用户登录、作业调度、备份等等,它的配置会影响上述性能。
4. pbs有很多版本,常用的有开源版torque,也有商业版pbs pro。不同的服务器厂商可能会把开源版torque进行一下改造包装,制定成他们自己的pbs版本。同一集群一般要求使用相同版本的pbs,最好能找到当初给你们架构集群和后期扩展的人进行一下配置,换了工程师的话应该真的不太敢动。

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
sobereva + 1

查看全部评分 View all ratings

198

帖子

0

威望

2241

eV
积分
2439

Level 5 (御坂)

5#
 楼主 Author| 发表于 Post on 2017-1-4 08:44:51 | 只看该作者 Only view this author
winterzen 发表于 2017-1-2 23:24
1. 是的,你计算Gaussian作业的临时文件会存在/tmp里,在你的计算节点上,根目录下的/tmp
2. 你的Gaussian ...

谢谢您的耐心解答,
     按照您的提示,我用df命令没有出现/opt或opt/software,说明Gaussian安装在本地目录,是不是安装在共享存储区更好呢?
     我说的服务器刀片应该是计算节点。想我这种环境变量的配置方法,因为临时文件存储在/tmp里,管理节点的硬盘容量和读写速度也会影响作业计算速度吧?
站在宇宙中心呼唤爱

77

帖子

0

威望

2592

eV
积分
2669

Level 5 (御坂)

6#
发表于 Post on 2017-1-4 10:41:30 | 只看该作者 Only view this author
1. 软件安装在本地也没什么问题。通常装在共享存储里是为了方便,只用装一次就可以而不用挨个节点去装,另外还能节省计算节点的硬盘。
2. 临时文件放在/tmp里面的话,管理节点的硬盘性能就基本不影响作业速度了。除非有些程序把很大的结果文件频繁地写入管理节点的共享存储里(如大的MD轨迹),这种情况下管理节点的硬盘才会影响计算速率,同时网络通信也会影响。

73

帖子

0

威望

144

eV
积分
217

Level 3 能力者

7#
发表于 Post on 2017-7-5 18:37:14 | 只看该作者 Only view this author
我想利用单位的高性能计算服务,但高性能计算机上没有装高斯软件,而我自己工作站上有高斯正版软件,请问在这种情况可利用高性能计算服务吗?

353

帖子

0

威望

2029

eV
积分
2382

Level 5 (御坂)

真 掘墓者

8#
发表于 Post on 2017-8-23 14:36:39 | 只看该作者 Only view this author
qcn 发表于 2017-7-5 18:37
我想利用单位的高性能计算服务,但高性能计算机上没有装高斯软件,而我自己工作站上有高斯正版软件,请问在 ...

不现实,最好在自己的usr文件夹下自行编译
圣诞刨坟忙

5万

帖子

99

威望

5万

eV
积分
112354

管理员

公社社长

9#
发表于 Post on 2017-8-23 15:10:43 | 只看该作者 Only view this author
qcn 发表于 2017-7-5 18:37
我想利用单位的高性能计算服务,但高性能计算机上没有装高斯软件,而我自己工作站上有高斯正版软件,请问在 ...

不能。需要也在你用的服务器上装上高斯
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 21:16 , Processed in 0.177851 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list