计算化学公社
标题: VASP5.4.4/内存报错+VASPKIT+CentOS7下装Materials Studio 8.0 [打印本页]
作者Author: wypkdhd 时间: 2020-1-13 21:51
标题: VASP5.4.4/内存报错+VASPKIT+CentOS7下装Materials Studio 8.0
本帖最后由 wypkdhd 于 2023-4-26 22:47 编辑
- 2020.2.16更新关于各种报错,内存溢出报错(任务跑了一段时间自动停止)等一些列有关mpi不兼容的问题。更新提任务后后台任务stopped的问题。
- 2020.4.26针对目前的戴尔R740服务器,以及centos6.9的系统,Intel® Parallel Studio XE 2020 最低支持centos7,故经过测试,vasp5.4.4使用XE2018的时候,会产生Intel MKL的错误Intel MKL ERROR: Parameter 4 was incorrect on entry to DSTEIN2。且这个问题只能更新XE解决,故最后采用XE2019 update5,采用2013版本的opemmpi1.6.5不太方便,根据上传的soft-hpc为2015版XE,可以直接单独安装里面的mpi2015,和2019不冲突,只需加入bashrc无需其他操作。
- 2020.11.22针对于曙光I620-G30服务器,centos7.6系统,同样采用intel XE的2019.5.281版本,在编译完成后,同样采用intel2015的mpi,测试完成后正常使用。
- 2021.7.2维护修改了细节,补充了各种所需文件的获取,单机任务号的确定,制作了目录,精简了安装过程。
- 2021.7.8补充在没有网络情况下离线centos7.6安装过程。
- 2021.12.14针对Dell的R750双路Gold6342cpu测试,已正常编译。针对VTST新版本184,区分了vasp6和6之前的版本,修订vasp安装部分的vtst部分。
- 2022.3.5 新年过后发现新的戴尔R750采用的都是H755阵列卡,根据官方文件RHEL_Support_Matrix发现新的H755阵列卡最低支持Centos7.8,后因课题组当年购买的为Materials Studio 2014 即为 MS 8.0,故补充并精简系统安装过程,更新Centos 7.9 系统的MS 8.0安装,防火墙设置以及gateway相关问题。近期将测试 Materials Studio 202x版本看看能否可行。
- 2022.10.20 针对mpi2015在超算等未拥有root条件的机器的安装,进行增补修改。
- 2023.4.18 目前课题组内安装系统已更换为Ventoy工具,故更新系统安装部分,简化系统安装的操作。
- 2023.4.26 针对dellR750的AMD zen3 7543 处理器配置,在vasp安装部分完成后,在bashrc中加入两行export MKL_DEBUG_CPU_TYPE=5和export MKL_CBWR=AVX2即可正常使用并拥有合理计算速度,具体测试有兴趣可查看EPYC 7543和Platinum 8358对比测试。此外,对于Zen 4处理器,EPYC 9654、EPYC 9554、EPYC 9374F等,支持AVX-512,估计只需要export MKL_DEBUG_CPU_TYPE=5加入bashrc即可。
本文参考的教程有:正确使用超算中心,5分钟搞定vasp5.4.4编译
http://bbs.keinsci.com/forum.php ... 11111&fromuid=16471
(出处: 计算化学公社)
VASP的最简单的安装方法(含全程视频演示)
http://bbs.keinsci.com/forum.php ... 11812&fromuid=16471
(出处: 计算化学公社)
vasp.6.1.0 更新介绍/安装/测试
http://bbs.keinsci.com/thread-16191-1-1.html(出处: 计算化学公社)
#####################################
VASP+VTST编译安装_vtst编译安装,vtstscripts,vasp安装_lwl_666的博客-CSDN博客
(出处: CSDN)
U盘安装CentOS7
(出处: CSDN)
U盘安装centos7.6步骤详细方案(图文教程)
(出处: CSDN)
特别感谢VASPKIT的各位开发者。
VASPKIT: A User-Friendly Interface Facilitating High-Throughput Computing and Analysis Using VASP Code
————————————————————————————————————————————————————————————————————————————————————————————————
(, 下载次数 Times of downloads: 1)
3. 系统安装过程参考U盘安装centos7.6步骤详细方案(图文教程),中文就行,唯一需要注意的是,在安装选择的时候,选择GUI,右侧全勾上(这里是懒省事,不想去看哪个包含所需)。这里如果不选择GUI按比如选择GNOME Desktop,将会在安装intel2019的时候出现,Xorg X11 libXss runtime library 缺失的问题。
(, 下载次数 Times of downloads: 1)
防火墙设置:
经过测试,添加单独ip或者ip段直接通过下述操作。
firewall-cmd --permanent --zone=public --add-rich-rule="rulefamily="ipv4" source address="192.168.1.1" portprotocol="tcp" port="1-65535" accept"
firewall-cmd --permanent --zone=public --add-rich-rule="rulefamily="ipv4" source address="192.168.15.0/24" portprotocol="tcp" port="1-65535" accept"
firewall-cmd --reload
firewall-cmd --list-all
#1-65536为纯粹懒省事给Materials Studio的18888端口放开,请根据实际需求更改。
装完centos7后防火墙默认配置是只打开SSH端口的,也就是22端口,就是默认放行ssh服务,不受firewalld-cmd的规则限制。所以需要移除默认开启的没有访问限制的ssh服务。
firewall-cmd --permanent --remove-service=ssh
firewall-cmd --reload
firewall-cmd --list-all
需要移除时,将命令中的add改成remove重新输入后reload即可。
——————————————————————————————————————————————————————————————————————————————————————————
——————————————————————————————————————————————————————————————————————————————————————————
卸载原先的intel库:如电脑未安装其他版本的intel XE则忽略此过程。
一、针对intel XE2013
VASP卸载流程
cd /opt/intel/composer_xe_2013.0.079/bin
./uninstall.sh
cd /opt/intel/composer_xe_2013.2.146/bin
./uninstall.sh
vi /etc/profile
下翻找到done,删除done以下
source/opt/intel/composer_xe_2013.2.146/bin/ifortvars.sh intel64
source/opt/intel/composer_xe_2013.0.079/bin/iccvars.sh intel64
source/opt/intel/composer_xe_2013.0.079/mkl/bin/intel64/mklvars_intel64.sh intel64
export PATH=/usr/local/openmpi-1.4.5/bin:$PATH
exportPATH=/opt/openmpi-1.4.5/bin:$PATH
exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/openmpi-1.4.5/lib
exportPATH=/home/software/vtstscripts:$PATH
二、针对2017-2020 XE其他版本。
寻找安装目录如:/opt/intel/parallel_studio_xe_2019.5.075
找到uninstall.sh运行
运行完后,手动删除整个opt下的intel目录。
安装Intel Parallel Studio XE 2019
- 2020.3.31特别说明,采用intel2018及以上版本编译,才可识别3647插槽的诸如6148,6152,8176等黄金白金cpu,使用的非3647插槽cpu,除了最新指令集没有之外,并无影响。
- 安装文件及证书放于VASPKIT群内(331895604)群文件名为parallel_studio_xe_2019_update5_cluster_edition.tgz和parallel_studio_2019.lic
- 编译器安装步骤为15步,请勿忽略第15步。
- 将XE2019的tgz文件上传或者复制到/home/software/intel2019文件夹。
- cd /home/software/intel2019
- tar -xzf parallel_studio_xe_2019_update5_cluster_edition.tgz将之解压。
- cd /home/software/intel2019/parallel_studio_xe_2019_update5_cluster_edition 输入./install.sh开始安装
- 出现欢迎界面,按“Enter”或“2”继续。
- 出现用户协议,连续按空格直到底部,按照提示输入 accept。
- 然后询问是否同意收集个人信息,选1之后检查计算机是否符合安装条件,需要等待。
- 然后询问用序列号还是license文件激活,选license文件 2
- 再询问使用离线license文件还是使用License Manager找到已有license文件,选第一项 1,输入license文件的绝对路径如/home/software/intel2019/parallel_studio_2019.lic
- 显示激活成功,按“Enter”继续
- 如出现 WARNING: Destination directory alreadyexists.-Do you want to continue?选择y,然后选择安装方式,继续默认,开始安装
- 然后发现电脑没有32位库,直接跳过,等待安装完成,按“Enter”退出。
- 装好后,使用vi ~/.bashrc命令编辑当前用户目录下的.bashrc文件,这里面的内容是每次进入bash终端时自动运行的。
- 把下面这行加入其中,用来自动配置Intel Parallel Studio XE的运行环境。
(蓝色字体为后续需要用部分,可直接一起添加)
source /opt/intel/compilers_and_libraries_2019.5.281/linux/bin/compilervars.sh intel64
source /opt/intel/compilers_and_libraries_2019.5.281/linux/mkl/bin/mklvars.sh intel64
source /opt/intel/profile.d/mpi_intelmpi-5.0.2.044.sh intel64
##################
export PATH=$PATH:/home/software/vasp.5.4.4/bin
export PATH=$PATH:/home/software/vtstscripts-947
export PATH=/home/software/vaspkit.1.12/bin:${PATH}
退出后source ~/.bashrc
15. 输入cd /opt/intel/compilers_and_libraries_2019.5.281/linux/mkl/interfaces/fftw3xf,运行make libintel64命令,过一会儿当前目录下会产生libfftw3xf_intel.a库文件。
——————————————————————————————————————————————————————————————————————————————————————————
——————————————————————————————————————————————————————————————————————————————————————————
VASP+VTST编译安装
(1) 准备工作
cd /home/software
tar -zxvf vasp.5.4.4.tar.gz
tar -zxvf vtstcode-179.tgz
#需要最新安装包请从官网下载,手动修改
http://theory.cm.utexas.edu/code/vtstcode-184.tgz红色部分的数字为
179复制到浏览器地址栏即可下载老版本。
tar -zxvf vtstscripts.tgz #和上方官网下载同样的地方下载。
tar xvf vtstscripts.tgz
gunzip patch.5.4.4.16052018.gz
cd vasp.5.4.4
patch -p0 < ../patch.5.4.4.16052018 #为vasp5.4.4打上补丁
cp src/chain.F src/chain.F-org
将vtstcode-179目录下文件复制到src下:
cp /home/software/vtstcode-179/* src/ #2021.12.14如果用的是最新版本184,此行代码换成cp /home/software/vtstcode-184/vtstcode5/* src/
(2) 修改工作
cd vasp.5.4.4
vi src/main.F
按esc,输入set number显示行号,按i调整为输入模式。
将(第3146行)
CALL CHAIN_FORCE(T_INFO%NIONS,DYN%POSION,TOTEN,TIFOR, &
LATT_CUR%A,LATT_CUR%B,IO%IU6)
变为:
CALL CHAIN_FORCE(T_INFO%NIONS,DYN%POSION,TOTEN,TIFOR, &
TSIF,LATT_CUR%A,LATT_CUR%B,IO%IU6)
按ecs,英文输入模式下shift+冒号,输入wq保存退出。
vi src/.objects
按esc,输入set number显示行号,按i调整为输入模式。
在chain.o(第72行)添加如下内容:
bfgs.o dynmat.o instanton.o lbfgs.o sd.o cg.o dimer.o bbm.o \
fire.o lanczos.o neb.o qm.o opt.o \
按ecs,shift+冒号,输入wq保存退出。
注:在chain.o前添加的内容应与原先的内容左对齐,意思需要输入tab来实现左边缘有空格。
#注意\后不能有空格。这里关于chain.o官网的写法有误,请按照上述输入。
(3)查看所用编辑器、IntelMPI环境和IntelMKL环境,出现目录即可。
which ifort
echo $MKLROOT
which mpiifort
(4)修改makefile.include文件
- 2020.1.16,请在OFLAG参数里加入-xHOST,这样编译器会使得编译出的程序能够利用当前机子CPU能支持的最高档次的指令集以加速计算,也因此就没必要手动添加其它一些VASP编译教程里诸如-xAVX、-mSSE4.2之类的选项了。
- 这里放上修改完成的makefile.include文件,如果intel编译版本不是为2019.5.281,如2019.1.144,请将文件中所有的2019.5.281修改为2019.1.144。
(, 下载次数 Times of downloads: 111)
用vasp.5.4.4\arch/makefile.include.linux_intel做模板进行修改
cp arch/makefile.include.linux_intel ./makefile.include
19行
FFLAGS = -assume byterecl -w -heap-arrays 64
20行
OFLAG = -O2 -xHOST (此处如果个人有需求,可以采用刘锦程老师帖子中的-O3)
23行
MKLROOT =/opt/intel/compilers_and_libraries_2019.5.281/linux/mkl
30行
OBJECTS = fftmpiw.o fftmpi_map.o fft3dlib.o fftw3d.o \
/opt/intel/compilers_and_libraries_2019.5.281/linux/mkl/interfaces/fftw3xf/libfftw3xf_intel.a
(5)安装前准备
为防止以前编译好的.o和.a文件与新修改的编译配置冲突,可通过以下命令清除以前编译文件:
cd vasp.5.4.4
make veryclean
删除vasp5.4.4/bin下的文件
(6)安装
make all
完成后在vi ~/.bashrc文件添加:这里如果在最开始已经添加过,可略过。 #2023.4.26 如用的是AMD Zen4 代以下的处理器,需要在bash中加入额外两行,export MKL_DEBUG_CPU_TYPE=5和export MKL_CBWR=AVX2
vi ~/.bashrc
source /opt/intel/compilers_and_libraries_2019.5.281/linux/bin/compilervars.sh intel64
source /opt/intel/compilers_and_libraries_2019.5.281/linux/mkl/bin/mklvars.sh intel64
source /opt/intel/profile.d/mpi_intelmpi-5.0.2.044.sh intel64
#-----q
export PATH=$PATH:/home/software/vasp.5.4.4/bin
export PATH=$PATH:/home/software/vtstscripts-947 #2021.12.14这里947位本人所使用版本,最新版本为978请自行更改。
export PATH=/home/software/vaspkit.1.12/bin:${PATH}
source ~/.bashrc
(7)测试
测试任务出自VASP的最简单的安装方法(含全程视频演示)
http://bbs.keinsci.com/forum.php?mod=viewthread&tid=11812&fromuid=16471
(出处: 计算化学公社)
对于centos系统,有时候会提交任务后有任何操作都会中止任务,任务无法后台,通过nohup mpirun -np 10 vasp_std > log.dat &进行提交任务。
log.dat 需要查看时候,通过notepad++打开,或者输入tail -f log.dat查看文件末尾几行,输入cat log.dat查看全部文件,使用xshell连接服务器时,可将notepad++设置为默认dat文件打开方式,在xftp里面选中文件右键直接打开。
(8)多余的话
如果你有数台一模一样配置的机器,vasp编译只需要做一次,做完一台服务器,通过scp -r 命令(具体请自行查找),将文件传到其他服务器上,装完intel2019以及2015以后将bashrc设置好即可正常使用vasp。
——————————————————————————————————————————————————————————————————————————————————————————
mpi不兼容造成的内存溢出
为了解决mpi造成的内存溢出问题,我们选择安装intel mpi2015,VASP用2019编译安装完之后,只需要再安装mpi2015的mpi,其他操作都可省去。
也可在VASPKIT FAQs群号331895604或理论计算化学研习社群号905699144中找到,找不到的请发言,随时会在群文件中补链接。
2020.2.23 经过一周测试,采用mpi2015后,一切正常,内存缓存buffer等可正常释放。
1.root用户可直接按照下方步骤进行,非root用户请参照本节末尾的 2.
将soft-hpc.tar.gz放入/home/software
cd /home/software
tar -zxvf soft-hpc.tar.gz
cd soft-hpc
./hpcsoft
# 执行完上面的命令, 第一步让输入安装路径/opt/intel, 第二步让选择安装的组件, 请只安装mpi2015。
添加环境变量
这里如果在最开始已经添加过,可略过。
vi ~/.bashrc
source /opt/intel/compilers_and_libraries_2019.5.281/linux/bin/compilervars.sh intel64
source /opt/intel/compilers_and_libraries_2019.5.281/linux/mkl/bin/mklvars.sh intel64
source /opt/intel/profile.d/mpi_intelmpi-5.0.2.044.sh intel64
#-----q
export PATH=$PATH:/home/software/vasp.5.4.4/bin
export PATH=$PATH:/home/software/vtstscripts-947
export PATH=/home/software/vaspkit.1.12/bin:${PATH}
source ~/.bashrc
附上安装后的图:
下图为安装完之后测试是否安装成功,输入which mpiexec后应该如下图所示。
(, 下载次数 Times of downloads: 16)
下图为提交vasp任务后,在终端输入ps ax中所显示的mpi所运行的版本状况。如果要删除任务,提交任务的pid如图中第三行
348008 pts/2 S 0:00 /opt/intel/mpi/intelmpi/5.0.2.044/intel64/bin/pmi_proxy --control-port localhost:43928 --pmi-connect lazy-cache --pmi-aggregate
348008就是对应的任务进程,kill 348008即可删除。此数字通常为通过nohup mpirun -np 10 vasp_std > log.dat &进行提交任务后所给出的[1] 000000中的数字加上一个固定数字,因机器不同而异。
(, 下载次数 Times of downloads: 19)
2. 非root
1.进入soft-hpc\mpi\intelmpi-5.0.2.044文件夹
2.编辑soft-hpc.cfg中的16,18和21行,将XXX修改为到soft-hpc文件夹的绝对路径,如下标红所示
#=== SPECIFIC SOFTWARE INSTALLATION DIRECTORY AND/OR ENVIRONMENTS FILE ===#
TIMESTAMP=`date +%Y%m%d%H%M%S`
type=mpi
name=intelmpi
version=5.0.2.044
export PUBLIC_PATH=XXX/soft-hpc/
export CP_ROOT_DIR=$(readlink -f $(dirname $BASH_SOURCE))
export CP_SOFT_DIR=${PUBLIC_PATH}/${type}/${name}/${version}
export CP_SOFT_ENV=${PUBLIC_PATH}/profile.d/${type}_${name}-${version}.sh
#export CP_SOFT_MODULE=${PUBLIC_PATH}/modules/${type}/${name}/${version}
#=== SOURCE FILES ===#
export CP_SRC_FILE=${CP_ROOT_DIR}/src/impi-${version}.tar.bz2
#=== CUSTOMIZED DEFINED CONFIGURATION FILE ===#
export CP_CFG_FILE=XXX/soft-hpc/conf/software_manager/${type}_${name}-${version}.cfg
#=== SOFTWARE INSTALLATION LOG FILE ===#
export CP_LOG_FILE=XXX/soft-hpc/conf/software_manager/${type}_${name}-${version}.log
#=== COMPILATION TEMPORARY DIRECTORY ===#
export CP_TMP_DIR=XXX/soft-hpc/tmp/soft-hpc.${TIMESTAMP}
(, 下载次数 Times of downloads: 0)
3.编辑install.sh中的72行为的绝对路径,如下标红所示
cp ${CP_SOFT_ENV} XXX/soft-hpc/profile.d
(, 下载次数 Times of downloads: 0)
4. 安装
安装位置输入到soft-hpc文件夹的路径,选择安装2
(, 下载次数 Times of downloads: 1)
5.根据实际位置加入~/.bashrc 或者手动 source XXX/soft-hpc/profile.d/mpi_intelmpi-5.0.2.044.sh intel64
——————————————————————————————————————————————————————————————————————————————————————————
vaspkit安装
解压缩tar zxvf vaspkit.1.12.linux.x64.tar.gz
cd /home/software/vaspkit.1.12
bash setup.sh
vi ~/.vaspkit
修改其中的
PBE_PATH /home/software/pbe # Path of PBE potential.
将potpaw_PBE.54.tar.gz放入/home/software/pbe,输入cd /home/software/pbe,然后tar zvxf potpaw_PBE.54.tar.gz
source ~/.bashrc
vaspkit更新版本后,新的文件放置位置和旧的在同一文件夹下,装过原先的版本只需更改环境变量,将export PATH=/home/software/vaspkit.1.xx/bin:${PATH}中的1.xx修改为实际版本后,source ~/.bashrc即可。成功后出现下图
(, 下载次数 Times of downloads: 19)
——————————————————————————————————————————————————————————————————————————————————————————
cd /home
tar -zxvf MaterialsStudio80.tgz
useradd -m ms80 #此用户名(ms80)可以随意设置,并无特殊要求。
chmod 777 /home (当多块硬盘时,当有一块硬盘挂载在home文件夹时,需要此操作,基本上在服务器中,都采用两块固态做Raid1,三块SAS做Raid5,不存在次问题。)
su - ms80
cd /home/MaterialsStudio80
./install
注:由于Centos7 版本原因出现安装软件时会出现 JRE 不匹配的错误,出现这种错误时需要安装一下glibc的32位库文件。
(, 下载次数 Times of downloads: 1)
(出现提示按Enter键,重复多次,看着不动了别急)
(出现99时输入99后退出)
su - root
cd /home/ms80/Accelrys/MaterialsStudio8.0/etc/Gateway/
注意:请修改当前目录下的msgateway_control_18888,用#注释掉22行,否则CentOS7.9将在服务器重启后无法自启动Gateway。
cp msgateway_control_18888 /etc/init.d/
chkconfig --add msgateway_control_18888
chkconfig --list |grep 18888 #centos7已经被systemctl替代(参考
1和
2)
,但是没有失效,上两行命令仍然有效。 最后手动复制msi证书到目标位置,可通过ssh或者xshell操作,文件夹路径:
cd /home/ms80/Accelrys/LicensePack/Licenses
注:如果遇到无法通过gateway提任务的情况,请首先尝试systemctl start msgateway_control_18888.service,然后查看服务启动状态
systemctl status msgateway_control_18888.service 如果失败,查看输出的信息中的提示。
——————————————————————————————————————————————————————————————————————————————————————————
作者Author: fineren 时间: 2020-1-14 14:06
学习了,打算什么时候试试安装
作者Author: wypkdhd 时间: 2020-1-16 21:43
会尽快更新XE2020的相关测试。
作者Author: dingniu2 时间: 2020-1-18 23:59
你好,请问
“23行
MKLROOT =/opt/intel/compilers_and_libraries_2019.1.144/linux/mkl
30行
OBJECTS = fftmpiw.o fftmpi_map.o fft3dlib.offtw3d.o \
/opt/intel/compilers_and_libraries_2019.1.144/linux/mkl/interfaces/fftw3xf/libfftw3xf_intel.a”
“VASP的最简单的安装方法”里没有这两步,请问这两步起到什么作用?谢谢!
作者Author: wolfpro 时间: 2020-1-20 11:30
解压软件linux下面可以使用p7zip
作者Author: wypkdhd 时间: 2020-1-26 10:54
加载vasp必要的库
作者Author: wypkdhd 时间: 2020-1-26 10:55
谢谢,学到了。
作者Author: noraa 时间: 2020-2-1 12:37
本帖最后由 noraa 于 2020-2-1 13:34 编辑
学习了!
作者Author: shenlan 时间: 2020-3-5 21:41
楼主您好,我按照步骤安装了XE2020和vasp5.4.4,在测试的时候失败了,显示ERROR no remote registered memory access transport to <no debug data>: self/self - Destination is unreachable,请问这是XE版本的问题吗,我需要换成2019版试试吗
作者Author: wypkdhd 时间: 2020-3-6 10:09
我没遇到过这个问题。你这个翻译说是远程内存错误之类的。你的意思是测试任务?你正常编译成功了否?如果正常编译了,那就是XE问题。
作者Author: lvweiqiang111 时间: 2020-3-24 02:53
修改 main.F 时CALLCHAIN应该为CALL CHAIN。不然编译不过。
作者Author: wypkdhd 时间: 2020-3-29 11:20
我的源文件有空格,这里灭有了,谢谢已经修改。
作者Author: xiaoxiaodiyi 时间: 2020-3-29 20:42
OBJECTS = fftmpiw.o fftmpi_map.o fft3dlib.offtw3d.o \
OBJECTS = fftmpiw.o fftmpi_map.o fft3dlib.o fftw3d.o \
注意这里有个空格,谢谢楼主编译成功~然后想问下楼主intel mpi2015可以有了嘛?总是内存溢出。。
作者Author: xiaoxiaodiyi 时间: 2020-3-29 20:45
另外
http://scc.ustc.edu.cn/zlsc/jsrj/201703/t20170330_273337.html
提供了/libfftw3xf_intel.a获取方法
作者Author: wypkdhd 时间: 2020-3-30 19:37
已经有了,我一直没放上来。你给个邮箱,我发给你。
作者Author: xiaoxiaodiyi 时间: 2020-3-31 09:57
1071482498@qq.com,谢谢~
作者Author: wypkdhd 时间: 2020-3-31 14:36
本帖最后由 wypkdhd 于 2020-3-31 14:53 编辑
完整百度云盘已经在帖子更新。
作者Author: xiaoxiaodiyi 时间: 2020-3-31 22:54
感谢~
作者Author: wowowo324 时间: 2020-7-23 08:42
你好,请问您那有这个软件吗? “parallel_studio_xe_2019_update5_cluster_edition.tgz”
作者Author: wypkdhd 时间: 2020-7-23 09:58
你好,我是从官网下的,找不到可以用2019update1,我实际测试过计算速度,是一模一样的。
作者Author: wypkdhd 时间: 2020-7-23 09:59
你可以自己去intel官网用学生邮箱注册,然后再论坛内有破戒补丁。
作者Author: wowowo324 时间: 2020-7-23 10:08
好的,多谢。
作者Author: wowowo324 时间: 2020-8-13 10:24
你好,能分享一下 soft-hpc.tar.gz 软件包吗?谢谢。
作者Author: wowowo324 时间: 2020-9-9 09:13
你好,我按照您以上的安装步骤安装了以上软件。但出现了一个问题:当断开Xshell连接后,运行的任务也停掉了。请问您知道这怎么解决吗?
提交命令是: mpirun -np 12 vasp > output &
当断开xshell连接后,出现:
Connection closed.
Disconnected from remote host(vasp) at 09:05:59.
下面三个截图是我操作的过程。麻烦帮忙看一下。
谢谢。
作者Author: wypkdhd 时间: 2020-9-9 09:19
可以用标准退出方式。ctrl+c然后ctrl+d,退出xshell,你也可以尝试一下,帖子中最下方,在mpirun -np 12 vasp > output & 前面加nohup。不过也有可能是编译器版本的问题。
作者Author: wowowo324 时间: 2020-9-9 10:13
你好,以下是我的软件版本。请问编译器版本问题怎么查找呢?我试了标准退出方式和nohup,都不行。谢谢。
[root@node1 ~]# which ifort
/opt/intel/compilers_and_libraries_2019.1.144/linux/bin/intel64/ifort
[root@node1 ~]# echo $MKLROOT
/opt/intel/compilers_and_libraries_2019.1.144/linux/mkl
[root@node1 ~]# which mpiifort
/opt/intel/mpi/intelmpi/5.0.2.044/intel64/bin/mpiifort
作者Author: wypkdhd 时间: 2020-9-9 11:46
我用的centos6.9,你这个库和我的也基本上一样,我觉得没啥问题。你一退出xshell任务就断这个事,我还真的不知道为啥。按理说个人服务器不会出现这情况。
作者Author: wowowo324 时间: 2020-9-9 11:56
我之前存在内存不释放的问题,按照您提供的安装步骤,都进行了安装,内存问题解决了。又出现了这个问题。
作者Author: wypkdhd 时间: 2020-9-9 19:58
我这边一直正常的。。我平时都是直接x掉xshell,毫无问题。你用的啥系统啊。
作者Author: wowowo324 时间: 2020-9-15 13:43
centos release 6.6
作者Author: wypkdhd 时间: 2020-9-15 15:04
我觉得是系统的问题。不是软件的问题,不行你尝试下用ssh登陆,别用xshell了。或者用winscp也可以。
作者Author: qiji2017 时间: 2020-11-5 13:10
我发现2015版本的mpi并行运算真的不吃内存,我用2019版的,256G内存都不够算10个离子步
作者Author: wypkdhd 时间: 2020-11-5 19:35
作者Author: wl1365688727 时间: 2020-12-11 10:50
本帖最后由 wl1365688727 于 2020-12-11 10:52 编辑
C:\Users\wulu\Desktop\erro.png,请问楼主有遇到这种情况么?纯新手还望指教指教
main.F(3146): error #6784: The number of actual arguments cannot be greater than the number of dummy arguments. [CHAIN_FORCE]
CALL CHAIN_FORCE(T_INFO%NIONS,DYN%POSION,TOTEN,TIFOR, &
-----------^
main.F(3147): error #6633: The type of the actual argument differs from the type of the dummy argument. [B]
TSIF, LATT_CUR%A,LATT_CUR%B,IO%IU6)
-------------------------------------^
main.F(3147): error #6634: The shape matching rules of actual arguments and dummy arguments have been violated. [B]
TSIF, LATT_CUR%A,LATT_CUR%B,IO%IU6)
作者Author: gog 时间: 2020-12-11 16:57
vasp 5.4.4 + intel xe 2018.4,兼容很好。目前使用了几个月,没有报错。
作者Author: wypkdhd 时间: 2020-12-11 17:09
你用的2015编译的?3146和3147行修改是编译VTST过渡态运算的。我看你这可能是编码格式问题,或者你没把需要的东西复制到src里面。将vtstcode-179目录下文件复制到src下:
cp /home/software/vtstcode-179/* src/
(2) 修改工作
cd vasp.5.4.4
vi src/main.F
按esc,输入set number显示行号,按i调整为输入模式。
将(第3146行)
CALL CHAIN_FORCE(T_INFO%NIONS,DYN%POSION,TOTEN,TIFOR, &
LATT_CUR%A,LATT_CUR%B,IO%IU6)
变为:
CALL CHAIN_FORCE(T_INFO%NIONS,DYN%POSION,TOTEN,TIFOR, &
TSIF,LATT_CUR%A,LATT_CUR%B,IO%IU6)
按ecs,shift+冒号,输入wq保存退出。
我把我的main.F上传给你。你试试好了。
作者Author: wypkdhd 时间: 2020-12-11 17:11
2018有的版本确实没有问题,超算还都是2018,但是在个人pc上,2018有时候会有问题,同样的任务,2019每个电子步的时间比2018要快一点,当然,只针对3647cpu。
作者Author: gog 时间: 2020-12-11 17:17
没对比国。空了,我重新编译了测试看看。
作者Author: wl1365688727 时间: 2020-12-14 10:33
谢谢啦
作者Author: wl1365688727 时间: 2020-12-14 11:27
使用您的main. F文件还是会有同样的错误,我在vtst官网下载的压缩包是vtstcode—180,可以麻烦您发一份vtst—179的压缩包给我吗?邮箱:1650659811@qq.com
作者Author: wypkdhd 时间: 2020-12-14 16:31
已发、如果还有问题,我感觉是你编译器的问题。
作者Author: wl1365688727 时间: 2020-12-15 14:53
文件的问题好像解决了,但是又出现其他问题了。还是很感谢您的帮助。
作者Author: scottwu 时间: 2020-12-21 18:35
亲测有效。但是在安装过程中发现,2019 parallel studio xe编译的vasp_std在比较老的处理器跑不了,会在标准输出出现forrtl: severe (168): Program Exception - illegal instruction。
作者Author: wypkdhd 时间: 2020-12-21 20:45
我提供了2015版本。用2019编译好之后,可以安装2015xe,让vasp在2015的intel环境下运行,甚至可以在2013环境下运行。
作者Author: scottwu 时间: 2020-12-22 10:48
本帖最后由 scottwu 于 2020-12-22 15:35 编辑
仍然不行。我怀疑是OFALG 这个参数我设成-O3 导致的--------
测试发现改成-O2也不行,机子太老的筒子们记得不要用太新的xe哦
作者Author: wypkdhd 时间: 2020-12-22 11:21
好的。我的意思是全程采用2015编译。
作者Author: nnu-xyk 时间: 2021-1-13 14:22
成功解决内存越来越大的问题,灰常感谢lz提供的帮助!
作者Author: wowowo324 时间: 2021-2-26 10:52
你好,我在编译vasp5.4.4时也出现了这个问题。请问您是如何解决的呢?谢谢。
作者Author: abin 时间: 2021-2-26 14:49
请勿使用微软系统下的编辑器 修改源码文件。
作者Author: wowowo324 时间: 2021-2-26 15:13
我都是在linux系统下修改的main文件。我用的是vtstcode-180。您后来更改为vtstcode-179了吗?
作者Author: abin 时间: 2021-2-26 15:39
未测试 vtst v180,不清楚。
你可以试试其他版本是否工作?
如果不工作,就是修改错了呀。
我这里,176, 179均工作。
180未测试,不清楚。
盲猜,代码修改错了, 比如换行之类的。
作者Author: wowowo324 时间: 2021-3-2 10:21
你好,我在安装mpi2015时出现了如下问题。
在check mpiicc...failed。具体log如下:
/opt/intel/compilers_and_libraries_2019.1.144/linux/bin/intel64/icc
hello
/opt/intel/compilers_and_libraries_2019.1.144/linux/bin/intel64/icpc
hello
/opt/intel/compilers_and_libraries_2019.1.144/linux/bin/intel64/ifort
/opt/intel/mpi/intelmpi/5.0.2.044/intel64/bin/mpiicc
icc -I/opt/intel//mpi/intelmpi/5.0.2.044/intel64/include -L/opt/intel//mpi/intelmpi/5.0.2.044/intel64/lib/release_mt -L/opt/intel//mpi/intelmpi/5.0.2.044/intel64/lib -Xlinker
--enable-new-dtags -Xlinker -rpath -Xlinker /opt/intel//mpi/intelmpi/5.0.2.044/intel64/lib/release_mt -Xlinker -rpath -Xlinker /opt/intel//mpi/intelmpi/5.0.2.044/intel64/lib -Xlinker -rpath -Xlinker /opt/intel/mpi-rt/5.0/intel64/lib/release_mt -Xlinker -rpath -Xlinker /opt/intel/mpi-rt/5.0/intel64/lib -lmpifort -lmpi -lmpigi -ldl -lrt -lpthread[mpiexec@node1] HYDU_getfullhostname (../../utils/others/others.c:146): getaddrinfo error (hostname: node1, error: Temporary failure in name resolution)
[mpiexec@node1] HYDU_sock_create_and_listen_portstr (../../utils/sock/sock.c:1094): unable to get local hostname
[mpiexec@node1] HYD_pmci_launch_procs (../../pm/pmiserv/pmiserv_pmci.c:350): unable to create PMI port
[mpiexec@node1] main (../../ui/mpich/mpiexec.c:987): process manager returned error launching processes
您遇到过这个问题吗? 谢谢。
作者Author: wypkdhd 时间: 2021-3-2 15:06
我确实没遇到过你这样的问题,log是啥?我感觉你为了这个事已经耽误几天了,你要不要老老实实把所有的都删除了,或者重装系统,老老实实按着流程来一遍?前几天还见你问社长没法编译64文件。你就按教程上的which xxx 都有就肯定可以啊。
作者Author: wowowo324 时间: 2021-3-8 15:39
现在问题解决了,谢谢。
作者Author: wypkdhd 时间: 2021-3-8 19:36
祝科研顺利。
作者Author: wzpsama 时间: 2021-3-17 15:30
您好,请问您的这个问题解决了吗
我现在用最新的oneAPI编译vasp后,每次多核运行也都会报这个错。
作者Author: ymeng 时间: 2021-5-20 17:57
您好,我编译vtst安装的时候一直出现这个报错是什么原因?另外一定要手动删除bin里的文件吗?目的是什么?
作者Author: sobereva 时间: 2021-5-20 20:23
贴图方式不对,其他人看不到。重新编辑帖子并仔细看置顶的新社员必读贴第4节了解怎么正确贴图,此问题在这里还特意强调了:http://bbs.keinsci.com/thread-18961-1-1.html
作者Author: ymeng 时间: 2021-5-23 23:00
对不起社长,以后发帖一定注意,报错是这样的。
make[2]: *** No rule to make target `\chain.f90', needed by `\chain.o'. Stop.
make[2]: Leaving directory `/home/gzu/vasp.5.4.4/build/std'
cp: cannot stat ‘vasp’: No such file or directory
make[1]: *** [all] Error 1
make[1]: Leaving directory `/home/gzu/vasp.5.4.4/build/std'
make: *** [std] Error 2
作者Author: Penson 时间: 2021-5-24 10:31
关键是intel编译器搭建好。我用2015版本的也成功编译过
作者Author: ymeng 时间: 2021-5-24 10:56
我下载的也是180,和这个版本有关系吗?
作者Author: wypkdhd 时间: 2021-5-24 14:32
有时候直接cp文件夹到另外服务器,bin下面会有原先编译的文件。
作者Author: wypkdhd 时间: 2021-5-24 14:33
个人认为没关系,不管是什么版本,main.F替换应该是没问题的。
作者Author: wypkdhd 时间: 2021-5-24 14:36
你这个需要检查编译器了,看你是chain.f90没法编译。
作者Author: ymeng 时间: 2021-5-24 15:13
现在又出现这个错误了呢!
作者Author: wypkdhd 时间: 2021-5-24 17:58
1./opt/intel/compilers_and_libraries_2019.5.281/linux/mkl/interfaces/fftw3xf 有没有libfftw3xf_intel.a?
2.which ifort 显示什么
3.echo $MKLROOT显示什么
4.which mpiexec 显示什么?
作者Author: ymeng 时间: 2021-5-24 22:03
是这样的:
作者Author: wypkdhd 时间: 2021-5-25 08:43
我知道你啥问题了。你bashrc没有按我那个做。。
source /opt/intel/compilers_and_libraries_2019.5.281/linux/bin/compilervars.sh intel64
source /opt/intel/compilers_and_libraries_2019.5.281/linux/mkl/bin/mklvars.sh intel64
source /opt/intel/profile.d/mpi_intelmpi-5.0.2.044.sh intel64
##################
export PATH=$PATH:/home/software/vasp.5.4.4/bin
export PATH=$PATH:/home/software/vtstscripts-947
export PATH=/home/software/vaspkit.1.12/bin:${PATH}
5.281改成你的1.144.改完之后source,你得用2019的编译器编译vasp。因为我记得makefile里面路径是2019。就是你which ifor 和mklroot 得是2019.
作者Author: jiongjiong 时间: 2021-10-25 10:06
本帖最后由 jiongjiong 于 2021-10-25 10:48 编辑
[root@localhost software]# tar -zxvf soft-hpc.tar.gz
soft-hpc/
soft-hpc/compiler/
soft-hpc/compiler/intel-2015.2.164/
soft-hpc/compiler/intel-2015.2.164/src/
soft-hpc/compiler/intel-2015.2.164/src/composer_xe_2015.2.164.tar.bz2
gzip: stdin: invalid compressed data--crc error
gzip: stdin: invalid compressed data--length error
tar: Unexpected EOF in archive
tar: Unexpected EOF in archive
tar: Error is not recoverable: exiting now
[root@localhost software]#
解压出现这样的问题怎么解决??
是文件下载的错误吗?
作者Author: wypkdhd 时间: 2021-10-25 18:04
https://www.cnblogs.com/leekwen/archive/2012/08/03/2620950.html
我在网上收到了你的报错,因为不知道你是啥系统,所以我感觉网上的解决办法挺好的。
作者Author: jiongjiong 时间: 2021-11-30 20:54
楼主遇到过这样的情况吗?我使用~/.vaspkit命令就出现这样的结果。但是vaspkit一些常用的功能可以使用。出现这种情况该怎么解决?
作者Author: jiongjiong 时间: 2021-11-30 22:07
谢谢,我的问题解决了
作者Author: wypkdhd 时间: 2021-12-1 08:46
我记得这个命令前 得有vi
作者Author: jiongjiong 时间: 2021-12-2 22:43
嗯呐,是用Vi这个命令去编辑vaspkit,赝势文件我就是用这个命令编辑的。但是我使用~/.vaspkit这个命令出现的结果应该不会对vaspkit的使用有影响吧。楼主你kebukeyi也试试这个命令,看看出现的是啥?
作者Author: wypkdhd 时间: 2021-12-4 11:49
[root@localhost ~]# ~/.vaspkit
-bash: /root/.vaspkit: Permission denied
作者Author: 这个世纪的我 时间: 2021-12-6 19:35
本帖最后由 这个世纪的我 于 2021-12-6 19:37 编辑
老师您好,请问“2020.2.16更新关于各种报错,内存满载报错(任务跑了一段时间自动停止)等一些列有关mpi不兼容的问题。更新提任务后后台任务stopped的问题。”体现在正文哪里了,我没有找到。
我现在遇到了:forrtl: severe (41): insufficient virtual memory,BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES的错误。该错误在运行任务的过程中,概率发生,vasp544,用2021onempi编译的。机器内存64g,正常运行时占用10g左右。尝试加上了ulimit -s unlimited没有用。感谢老师的解答,谢谢!
作者Author: jiongjiong 时间: 2021-12-6 21:21
谢谢 楼主
作者Author: wypkdhd 时间: 2021-12-7 09:21
体现在用了mpi2015。
作者Author: hzliew 时间: 2021-12-7 21:33
compilation aborted for /opt/intel/compilers_and_libraries_2020.0.139/linux/mkl/
interfaces/fftw3xf/wrappers/fftw_alignment_of.c (code 2)
make[1]: *** [makefile:150:obj_intel/fftw_alignment_of.o] 错误 2
make[1]: 离开目录“/opt/intel/compilers_and_libraries_2020.0.139/linux/mkl/interf
aces/fftw3xf”
这种错误怎么处理啊
作者Author: wypkdhd 时间: 2021-12-7 22:46
hzliew 发表于 2021-12-7 21:33
compilation aborted for /opt/intel/compilers_and_libraries_2020.0.139/linux/mkl/
interfaces/fftw3xf ...
建议看看装完intel之后,是否成功source了,看看文中有几个which命令。
作者Author: 这个世纪的我 时间: 2021-12-10 09:36
感谢老师,之前以为这一块只是解决的内存溢出,重复了以后没有报错了,谢谢!
作者Author: lufei 时间: 2022-1-4 09:59
老师,您好,我是一个纯新手,刚刚安装了vasp,运行测试文件的时候,出现了这个问题,报错forrtl: severe (174): SIGSEGV, segmentation fault occurred,请问一下这个怎么解决
作者Author: wypkdhd 时间: 2022-1-4 17:26
表示你可以详细描述下你怎么装的,现在是虚拟机还是服务器,服务器配置是啥。
作者Author: snljty 时间: 2022-3-8 20:25
最近遇到一个诡异的情况,在一台CentOS 8 Stream实体机(已安装OneAPI,使用其编译器安装Intel MPI 2015)这个2015版本的Intel MPI安装过程中卡死(已写完/etc/profile.d/mpi*.sh),几个小时无反应,终端无响应。检查top发现一个叫pmi_proxy的进程占了100%的CPU,kill命令无法杀掉。强行关闭终端后该版本mpi的wrapper如mpicc等似乎能正常使用,但mpirun无法正常使用。重启系统后加载环境,用mpirun跑任意命令都会卡死,CPU占用100%(指单核),同样是pmi_proxy进程占满。不知道该从哪个角度排障,还请赐教。
作者Author: wypkdhd 时间: 2022-3-10 15:33
这我琢么了好久,难不成你装的时候,oneapi里面自带的新版本mpi没注释掉,冲突了?然后pmi_proxy 就是mpi的进程,你问我咋办,我还真的没遇到过。上面理由纯粹猜测。
我这边正常是这样/opt/intel/mpi/intelmpi/5.0.2.044/intel64/bin/pmi_proxy --control-port localhost:38763 --pmi-connect lazy-cache --pmi-a。。oneapi我没装过,装2019 2018 intel的时候,bashrc里面不能写source *****/bin/psxevars.sh和mpivars.sh intel64,只能写compilervars.sh intel64和mklvars.sh intel64
作者Author: snljty 时间: 2022-3-10 15:51
不是的,我环境一开始是空的,然后要装mpi2015才source /opt/intel/oneapi/compiler/latest/env/vars.sh intel64,并没有加载其他环境。不过谢谢您的回复!
作者Author: wypkdhd 时间: 2022-3-10 16:32
不好意思,我太菜了,帮不了你。确实想不通,可能在你加载vars.sh时候里面包含的psxevars.sh还是psxevars.sh,这只能vi看一下vars.sh,因为psxevars.sh 包含了运行mpi的脚本,意味着那时候你的新版mpi正在运行着,然后你装老版本mpi,如果两个冲突肯定gg,可以加载玩vars.sh后,which mpiexec看看当前运行的mpi是谁。
作者Author: snljty 时间: 2022-3-10 17:20
这个我倒是确定没弄错,不管是看$PATH还是which mpicc或者which mpirun之类的结果...顺便您太谦虚了
作者Author: 枝江向大头 时间: 2022-3-12 09:22
楼主你好,请问MPI内存不释放是指的是vasp进程内存越占越大是么。最近有个结构总是跑几个小时没报错就停止了,和这个有关系么,内存的确是越占越大但还没有占满,使用的2019MPI
作者Author: wypkdhd 时间: 2022-3-12 17:20
是的,就是内存越跑越大,通过free -h 或者top 可以看到可用越来越少,直到报错。
作者Author: 枝江向大头 时间: 2022-3-12 22:52
问题是这样的
作者Author: 枝江向大头 时间: 2022-3-12 23:01
这个问题已经解决了 这个是因为之前的时候2019的mpi找不到自己的库,我写了环境变量,改用2015忘记注释掉了
作者Author: 枝江向大头 时间: 2022-3-12 23:30
老师您好 现在有个新的问题 我所使用的服务器是双CPU的,之前使用MPI2019的时候是如果我输入mpirun -np 32 会将32个进程平均分配给两个CPU,一边十六个进程。MPI2015我这样做的时候会把所有进程按照CPU序号分配,全部分配给了一个CPU,另一个空闲。这样由于内存的原因速度较慢。请问有什么办法可以将进程像之前一样分配给两个CPU呢
作者Author: wypkdhd 时间: 2022-3-13 15:29
说实话,你这个问题我从来没注意到过,如果是这样,我估摸只能换2018或者openmpi了,就和超算平台一样。我完全么考虑过这个问题,因为我服务器基本上双路共40个核心,平时都超过一路的提法。
作者Author: 枝江向大头 时间: 2022-3-13 18:04
2018的IMPI也不会内存溢出是么
作者Author: 枝江向大头 时间: 2022-3-13 18:05
这个新版本的IMPI的内存溢出是bug还是什么机制造成的呢,按理说新版本应该更好用一点
作者Author: wypkdhd 时间: 2022-3-14 09:00
超算品台基本上都是2018,就是刘博编译vasp6的那个帖子,我帖子最头处引用了。
作者Author: wypkdhd 时间: 2022-3-14 09:01
不知道,我去谷歌搜索过,就是有这个问题,但是好像intel oneAPI没问题。
作者Author: 枝江向大头 时间: 2022-3-16 17:18
oneAPI不好用么 我看公社里基本都是用XE2020及以往的版本,我们组里是个AMD的服务器只能用19版本之前的速度才快。
作者Author: snljty 时间: 2022-3-16 17:24
换了几个别的2015版本的不同子版本的Intel Parallel Studio XE MPI,全都有这个问题无法使用。不清楚是不是和系统有关。系统是大约半个月前的CentOS 8 Stream。
欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |