计算化学公社

标题: windows下用ssh连接到服务器 [打印本页]

作者
Author:
kevin    时间: 2017-1-1 11:17
标题: windows下用ssh连接到服务器
各位老师,
       我有几个服务器的问题想请教一下,我先简单描述下我的服务器:
       我这里总共有两台刀片式服务器,HP 460C的,还有浪潮的(型号不太清楚),公用同一个节点。HP的比较老了,昨天换了硬盘,重新装了系统。现在的问题是,用ssh链接,换了系统的四个刀片的状态显示的是down(命令是pbsnodes -l),高斯、MS等软件是安装在节点上的。
      我的问题是:
      1. 软件安装在节点上的话,计算时硬盘容量大小要看节点的,cup使服务器的,我的理解对么?
      2. 现在显示down的状态,我该怎么解决?
      谢谢各位老师,祝各位老师新年快乐!

作者
Author:
winterzen    时间: 2017-1-2 16:16
1. 这个和你的集群的架构有关,一般计算集群中的计算节点都要挂载一个和管理节点共用的共享存储(如通过Lustre、GFPS等并行文件系统或通过NFS挂载一个共享分区等方式)。通常计算软件都会安在共享存储区里,不清楚你说的“安装在节点上”是在节点的共享存储还是在计算节点本地。计算时硬盘使用要看你用的软件指定了哪里去存放中间临时文件(如Gaussian中GAUSS_SCRDIR变量的设置)。如果你指定计算节点的本地目录存放,容量就看计算节点的;如果指定了共享存储区,容量就看共享区的。CPU都是使用运行作业的那个计算节点的。

2.
(1)首先检查一下网络连接。从管理节点去ping一下你down状态的节点看看是否可以ping通,确保网络配置正确。
(2)检查作业调度系统是否安装配置正确,你的调度系统应该是torque吧?确保管理节点和计算节点torque的配置都正确。
作者
Author:
kevin    时间: 2017-1-2 22:54
winterzen 发表于 2017-1-2 16:16
1. 这个和你的集群的架构有关,一般计算集群中的计算节点都要挂载一个和管理节点共用的共享存储(如通过Lus ...

谢谢您的回答,还有几个问题想请教您:
1. 我是通过pbs文件和qusb命令提交gaussian作业的,应该就是您说的torque吧。我的安装文件下没有找到GAUSS_SCRDIR这个文件,但是我的pbs文件里有设置,应该是临时变量:
g09root=/opt/software/gaussian
export GAUSS_EXEDIR=$g09root/g09
export GAUSS_SCRDIR=/tmp/
export PATH=$PATH:$g09root/g09/
source $g09root/g09/bsd/g09.profile
这里的意思是临时文件存储在tmp这个文件夹里吧,这个文件夹在什么地方呢?我找了半天没找到。
2. 我也不清楚我的软件安装在哪里,我怎么判断呢?
3. CPU用的是计算节点的话,我的服务器刀片配置就没什么意义了吧。
4. 我请工程师来维修了一下,他说我原来的刀片上安装了PBS客户端,但是他现在找不到我的安装文件,所以没敢动。浪潮的机器买的晚,当时可能是为了节省经费吧,结果浪潮的服务器直接用了HP的节点,所以现在需要原来安装浪潮是的pbs客户端。我不太理解,这个pbs客户端不是应该随便都可以么,必须要一样么?或者浪潮有专门的pbs客户端是我们一般人拿不到的么?
作者
Author:
winterzen    时间: 2017-1-2 23:24
1. 是的,你计算Gaussian作业的临时文件会存在/tmp里,在你的计算节点上,根目录下的/tmp
2. 你的Gaussian安装在/opt/software/gaussian目录下,你从计算节点上看看/opt/software目录是本地目录还是网络挂载的,执行df命令,看看有没有网络挂载点指向/opt或/opt/software。如果没有就是本地目录。
3. "服务器刀片"是指你的管理节点吗?作业计算速率取决于计算节点的配置,和管理节点关系不大。管理节点主要负责用户登录、作业调度、备份等等,它的配置会影响上述性能。
4. pbs有很多版本,常用的有开源版torque,也有商业版pbs pro。不同的服务器厂商可能会把开源版torque进行一下改造包装,制定成他们自己的pbs版本。同一集群一般要求使用相同版本的pbs,最好能找到当初给你们架构集群和后期扩展的人进行一下配置,换了工程师的话应该真的不太敢动。
作者
Author:
kevin    时间: 2017-1-4 08:44
winterzen 发表于 2017-1-2 23:24
1. 是的,你计算Gaussian作业的临时文件会存在/tmp里,在你的计算节点上,根目录下的/tmp
2. 你的Gaussian ...

谢谢您的耐心解答,
     按照您的提示,我用df命令没有出现/opt或opt/software,说明Gaussian安装在本地目录,是不是安装在共享存储区更好呢?
     我说的服务器刀片应该是计算节点。想我这种环境变量的配置方法,因为临时文件存储在/tmp里,管理节点的硬盘容量和读写速度也会影响作业计算速度吧?
作者
Author:
winterzen    时间: 2017-1-4 10:41
1. 软件安装在本地也没什么问题。通常装在共享存储里是为了方便,只用装一次就可以而不用挨个节点去装,另外还能节省计算节点的硬盘。
2. 临时文件放在/tmp里面的话,管理节点的硬盘性能就基本不影响作业速度了。除非有些程序把很大的结果文件频繁地写入管理节点的共享存储里(如大的MD轨迹),这种情况下管理节点的硬盘才会影响计算速率,同时网络通信也会影响。
作者
Author:
qcn    时间: 2017-7-5 18:37
我想利用单位的高性能计算服务,但高性能计算机上没有装高斯软件,而我自己工作站上有高斯正版软件,请问在这种情况可利用高性能计算服务吗?
作者
Author:
kyuu    时间: 2017-8-23 14:36
qcn 发表于 2017-7-5 18:37
我想利用单位的高性能计算服务,但高性能计算机上没有装高斯软件,而我自己工作站上有高斯正版软件,请问在 ...

不现实,最好在自己的usr文件夹下自行编译
作者
Author:
sobereva    时间: 2017-8-23 15:10
qcn 发表于 2017-7-5 18:37
我想利用单位的高性能计算服务,但高性能计算机上没有装高斯软件,而我自己工作站上有高斯正版软件,请问在 ...

不能。需要也在你用的服务器上装上高斯




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3