计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: wypkdhd
打印 Print 上一主题 Last thread 下一主题 Next thread

[VASP] VASP5.4.4/内存报错+VASPKIT+CentOS7下装Materials Studio 8.0

  [复制链接 Copy URL]

10

帖子

0

威望

79

eV
积分
89

Level 2 能力者

76#
发表于 Post on 2021-12-6 19:35:01 | 只看该作者 Only view this author
本帖最后由 这个世纪的我 于 2021-12-6 19:37 编辑

老师您好,请问“2020.2.16更新关于各种报错,内存满载报错(任务跑了一段时间自动停止)等一些列有关mpi不兼容的问题。更新提任务后后台任务stopped的问题。”体现在正文哪里了,我没有找到。
我现在遇到了:forrtl: severe (41): insufficient virtual memory,BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES的错误。该错误在运行任务的过程中,概率发生,vasp544,用2021onempi编译的。机器内存64g,正常运行时占用10g左右。尝试加上了ulimit -s unlimited没有用。感谢老师的解答,谢谢!

5

帖子

0

威望

41

eV
积分
46

Level 2 能力者

77#
发表于 Post on 2021-12-6 21:21:21 | 只看该作者 Only view this author
wypkdhd 发表于 2021-12-4 11:49
[root@localhost ~]# ~/.vaspkit
-bash: /root/.vaspkit: Permission denied

谢谢 楼主

281

帖子

2

威望

4568

eV
积分
4889

Level 6 (一方通行)

打脸只许打一次

78#
 楼主 Author| 发表于 Post on 2021-12-7 09:21:10 | 只看该作者 Only view this author
这个世纪的我 发表于 2021-12-6 19:35
老师您好,请问“2020.2.16更新关于各种报错,内存满载报错(任务跑了一段时间自动停止)等一些列有关mpi不 ...

体现在用了mpi2015。

14

帖子

0

威望

31

eV
积分
45

Level 2 能力者

79#
发表于 Post on 2021-12-7 21:33:33 | 只看该作者 Only view this author
compilation aborted for /opt/intel/compilers_and_libraries_2020.0.139/linux/mkl/
interfaces/fftw3xf/wrappers/fftw_alignment_of.c (code 2)
make[1]: *** [makefile:150:obj_intel/fftw_alignment_of.o] 错误 2
make[1]: 离开目录“/opt/intel/compilers_and_libraries_2020.0.139/linux/mkl/interf
aces/fftw3xf”
这种错误怎么处理啊

281

帖子

2

威望

4568

eV
积分
4889

Level 6 (一方通行)

打脸只许打一次

80#
 楼主 Author| 发表于 Post on 2021-12-7 22:46:55 | 只看该作者 Only view this author
hzliew 发表于 2021-12-7 21:33
compilation aborted for /opt/intel/compilers_and_libraries_2020.0.139/linux/mkl/
interfaces/fftw3xf ...

建议看看装完intel之后,是否成功source了,看看文中有几个which命令。

10

帖子

0

威望

79

eV
积分
89

Level 2 能力者

81#
发表于 Post on 2021-12-10 09:36:52 | 只看该作者 Only view this author
wypkdhd 发表于 2021-12-7 09:21
体现在用了mpi2015。

感谢老师,之前以为这一块只是解决的内存溢出,重复了以后没有报错了,谢谢!

1

帖子

0

威望

9

eV
积分
10

Level 1 能力者

82#
发表于 Post on 2022-1-4 09:59:30 | 只看该作者 Only view this author
老师,您好,我是一个纯新手,刚刚安装了vasp,运行测试文件的时候,出现了这个问题,报错forrtl: severe (174): SIGSEGV, segmentation fault occurred,请问一下这个怎么解决

202201040957577467..png (90.25 KB, 下载次数 Times of downloads: 96)

202201040957577467..png

281

帖子

2

威望

4568

eV
积分
4889

Level 6 (一方通行)

打脸只许打一次

83#
 楼主 Author| 发表于 Post on 2022-1-4 17:26:13 | 只看该作者 Only view this author
lufei 发表于 2022-1-4 09:59
老师,您好,我是一个纯新手,刚刚安装了vasp,运行测试文件的时候,出现了这个问题,报错forrtl: severe ( ...

表示你可以详细描述下你怎么装的,现在是虚拟机还是服务器,服务器配置是啥。

1187

帖子

5

威望

2859

eV
积分
4146

Level 6 (一方通行)

84#
发表于 Post on 2022-3-8 20:25:19 | 只看该作者 Only view this author
最近遇到一个诡异的情况,在一台CentOS 8 Stream实体机(已安装OneAPI,使用其编译器安装Intel MPI 2015)这个2015版本的Intel MPI安装过程中卡死(已写完/etc/profile.d/mpi*.sh),几个小时无反应,终端无响应。检查top发现一个叫pmi_proxy的进程占了100%的CPU,kill命令无法杀掉。强行关闭终端后该版本mpi的wrapper如mpicc等似乎能正常使用,但mpirun无法正常使用。重启系统后加载环境,用mpirun跑任意命令都会卡死,CPU占用100%(指单核),同样是pmi_proxy进程占满。不知道该从哪个角度排障,还请赐教。

281

帖子

2

威望

4568

eV
积分
4889

Level 6 (一方通行)

打脸只许打一次

85#
 楼主 Author| 发表于 Post on 2022-3-10 15:33:06 | 只看该作者 Only view this author
snljty 发表于 2022-3-8 20:25
最近遇到一个诡异的情况,在一台CentOS 8 Stream实体机(已安装OneAPI,使用其编译器安装Intel MPI 2015) ...

这我琢么了好久,难不成你装的时候,oneapi里面自带的新版本mpi没注释掉,冲突了?然后pmi_proxy 就是mpi的进程,你问我咋办,我还真的没遇到过。上面理由纯粹猜测。
我这边正常是这样/opt/intel/mpi/intelmpi/5.0.2.044/intel64/bin/pmi_proxy --control-port localhost:38763 --pmi-connect lazy-cache --pmi-a。。oneapi我没装过,装2019 2018 intel的时候,bashrc里面不能写source *****/bin/psxevars.sh和mpivars.sh intel64,只能写compilervars.sh intel64和mklvars.sh intel64

1187

帖子

5

威望

2859

eV
积分
4146

Level 6 (一方通行)

86#
发表于 Post on 2022-3-10 15:51:43 | 只看该作者 Only view this author
wypkdhd 发表于 2022-3-10 15:33
这我琢么了好久,难不成你装的时候,oneapi里面自带的新版本mpi没注释掉,冲突了?然后pmi_proxy 就是mpi ...

不是的,我环境一开始是空的,然后要装mpi2015才source /opt/intel/oneapi/compiler/latest/env/vars.sh intel64,并没有加载其他环境。不过谢谢您的回复!

281

帖子

2

威望

4568

eV
积分
4889

Level 6 (一方通行)

打脸只许打一次

87#
 楼主 Author| 发表于 Post on 2022-3-10 16:32:37 | 只看该作者 Only view this author
snljty 发表于 2022-3-10 15:51
不是的,我环境一开始是空的,然后要装mpi2015才source /opt/intel/oneapi/compiler/latest/env/vars.sh  ...

不好意思,我太菜了,帮不了你。确实想不通,可能在你加载vars.sh时候里面包含的psxevars.sh还是psxevars.sh,这只能vi看一下vars.sh,因为psxevars.sh 包含了运行mpi的脚本,意味着那时候你的新版mpi正在运行着,然后你装老版本mpi,如果两个冲突肯定gg,可以加载玩vars.sh后,which mpiexec看看当前运行的mpi是谁。

1187

帖子

5

威望

2859

eV
积分
4146

Level 6 (一方通行)

88#
发表于 Post on 2022-3-10 17:20:47 | 只看该作者 Only view this author
wypkdhd 发表于 2022-3-10 16:32
不好意思,我太菜了,帮不了你。确实想不通,可能在你加载vars.sh时候里面包含的psxevars.sh还是psxevars ...

这个我倒是确定没弄错,不管是看$PATH还是which mpicc或者which mpirun之类的结果...顺便您太谦虚了

15

帖子

0

威望

96

eV
积分
111

Level 2 能力者

89#
发表于 Post on 2022-3-12 09:22:20 | 只看该作者 Only view this author
楼主你好,请问MPI内存不释放是指的是vasp进程内存越占越大是么。最近有个结构总是跑几个小时没报错就停止了,和这个有关系么,内存的确是越占越大但还没有占满,使用的2019MPI

281

帖子

2

威望

4568

eV
积分
4889

Level 6 (一方通行)

打脸只许打一次

90#
 楼主 Author| 发表于 Post on 2022-3-12 17:20:30 | 只看该作者 Only view this author
枝江向大头 发表于 2022-3-12 09:22
楼主你好,请问MPI内存不释放是指的是vasp进程内存越占越大是么。最近有个结构总是跑几个小时没报错就停止 ...

是的,就是内存越跑越大,通过free -h 或者top 可以看到可用越来越少,直到报错。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 12:11 , Processed in 0.211982 second(s), 28 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list