计算化学公社

 找回密码 Forget password
 注册 Register
Views: 12287|回复 Reply: 11
打印 Print 上一主题 Last thread 下一主题 Next thread

[VASP] 求助:vasp并行运行一段时间后报错Fatal error in PMPI_Recv: Unknown error class...

[复制链接 Copy URL]

63

帖子

0

威望

223

eV
积分
287

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 静哥哥 于 2022-2-16 19:25 编辑

群里的大佬们:      我这连天新遇到一个奇怪的问题,我在新买的双路服务器(社长帖子推荐的8375c那个配置)上按照社长的帖子(VASP的最简单的安装方法(含全程视频演示))装好了vasp5.4.4和parallel_studio_xe_2019_update1_cluster_edition,用了几天一切正常。但是今天在跑一个56个原子异质结的时候中途程序突然停止,很奇怪,出现报错,请问这个怎么解决呢。最主要的问题是程序跑了23步,跑了几个小时才停止。后面附上我的incar和kpoints .

Abort(269604713) on node 0 (rank 0 in comm 0): Fatal error in PMPI_Recv: Unknown error class, error stack:
PMPI_Recv(171)........: MPI_Recv(buf=0x7fb3d34492b8, count=16, dtype=USER<contig>, src=MPI_ANY_SOURCE, tag=642285, comm=0xc4000017, status=0x7fff0b9c1d10) failed
MPID_Recv(234)........:
MPIDI_OFI_do_irecv(68): failure occurred while allocating memory for a request object
[cli_0]: readline failed
forrtl: error (78): process killed (SIGTERM)
Image              PC                Routine            Line        Source            
vasp               000000000147D324  Unknown               Unknown  Unknown
libpthread-2.17.s  00007FB4E0052630  Unknown               Unknown  Unknown
vasp               000000000147CD70  Unknown               Unknown  Unknown
forrtl: error (78): process killed (SIGTERM)
Image              PC                Routine            Line        Source            
vasp               000000000147D324  Unknown               Unknown  Unknown
libpthread-2.17.s  00007F21CEEEA630  Unknown               Unknown  Unknown
libmpi.so.12.0.0   00007F21CFDD157F  Unknown               Unknown  Unknown
libmpi.so.12.0.0   00007F21CFD5BF56  Unknown               Unknown  Unknown
libmpi.so.12.0.0   00007F21CFDD6F9D  Unknown               Unknown  Unknown
libmpi.so.12.0.0   00007F21CFDD3746  MPI_Bcast             Unknown  Unknown



我的INCAR
SYSTEM= hetero OPT   #第一行为注释行
# 1初始参数
ISTART = 0   #如何生成波函数,首次结构优化用0。如果进行能带、电子结构计算,使用ISTART=1(读取优化的波函数,比CHGCAR快),ICHARG=11
ICHARG = 2    #如何获得初始电荷密度,首次结构优化用2,通过原子电荷叠加初猜电荷密度。算能带和dos需要用11,读取前面的CHGCAR
ISMEAR = 0  #决定电子轨道分数占据。0适用于导体、半导体和绝缘体.
            #对于金属体系来说,也可以使用ISMEAR = 1,SIGMA = 0.01
            #算dos时,ISMEAR =-5(K大于4),可以得到一个非常平滑的DOS图
            #如果体系很大,只能适用gamma点来算,可以使用ISMEAR = 0;SIGMA = 0.01。
SIGMA = 0.1 #展宽默认为0.2.对于半导体和绝缘体,k小于4,sigma可以取小点,比如0.01-0.05。对于金属,取0.1足够。对于分子取0.02

# 2自洽迭代,SCF,电子优化
ENCUT = 350  #截断能, ENCUT的最小值应为所有元素中ENMAX的最大值或1.3倍左右.第一次为了获得稳定的晶格常数,可以设置为600
EDIFF = 1E-4   # 能量收敛标准ev.结构优化的时候,EDIFF=1E-5, EDIFFG =-0.01 至 -0.03 都是被认可的
NELM = 60
ALGO = Normal #不写就默认为Normal,DAV算法,收敛性好,但速度慢.结构好可以用Fast

# 3原子弛豫,离子弛豫,结构优化
IBRION = 2    #2代表离子原子位置优化.不写就默认为-1,即原子位置不优化,一般1用于静态计算
POTIM = 0.1   # 离子移动步距,一般在0.1——0.5间.如果初始结构很差,设置较小的POTIM可以有效的避免过度矫正,比如0.01
ISIF = 2    #2代表只优化原子位置,3代表原子和晶胞都优化,6只优化晶胞。对于切片或二维材料、多变量不能用3
            #Tips:复杂的结构优化过程,可以分步优化,即初始只优化离子(ISIF=2)→优化晶胞(ISIF=6)→优化离子和晶胞(ISIF=3)
NSW = 200   #最大离子步数,单点能计算,如果晶胞优化后进行静态计算,NSW需要设置为0
EDIFFG = -0.05  #不写即默认,此时EDIFFG = EDIFF×10,即能量收敛,正数为能量收敛ev。负数表示力收敛,ev/埃,一般在-0.01-0.05间

# 4态密度和能带相关
# LWAVE = .F. #控制是否输出波函数和电荷密度
# LCHARG = .F.
# NEDOS = 2000  #DOS点的个数,通常设置1000-3000
# EMIN  
# EMAX  #计算态密度的能量窗口
# LORBIT      #总态密度投影,10:投影到s、p、d、f轨道.11:投影到s、px、py、pz.....轨道
# NBANDS  #总能带数

#5磁性和加U以及偶极矫正
# ISPIN = 1 #1为默认值,表示不进行自旋极化计算。2表示需要进行自旋极化计算
# MAGMOM = 原子个数*磁矩   #如果原子的MAGMOM为负值,则写成原子数乘负的磁矩,如氧10*-2
# IVDW    #范德华力计算方法
# LDA+U
# LDIPOL = .TRUE.  #偶极矫正,Slab模型一般都需要加上这个参数
# IDIPOL = 3    #偶极矫正,Slab模型一般都需要加上这个参数
# NCORE = 32   #NCORE = 节点核数/2

KPOINTS
K-Spacing Value to Generate K-Mesh: 0.040
0
Gamma
   4   4   1
0.0  0.0  0.0


我的服务器
CPU:2* XEON Platinum 8375C正式版(32核2.9G,全核睿频到3.5G,散,无集显)2*10000
散热器:2*金钱豹LGA4189 5热管双风扇散热器  2*310
主板:超微X12DPi-N6 5700
机械硬盘:希捷 企业级 银河Exos 4TB 256MB 7200rpm SATA3 (ST4000NM000A) 990
固态硬盘:三星PM9A1 2TB 1450
内存:16*三星DDR4-3200 ECC REG 16GB  16*500
电源:海韵FOCUS GX1000 额定1000W  1320
机箱:追风者614PC 550
键盘鼠标:罗技MK200 多媒体套装  90









240

帖子

1

威望

4039

eV
积分
4299

Level 6 (一方通行)

2#
发表于 Post on 2022-2-16 20:41:38 | 只看该作者 Only view this author
没看到全部输入文件。应该是mpi导致内存泄漏,曾在intel2019上遇到这样的问题,换了intel2018的就没事了。

63

帖子

0

威望

223

eV
积分
287

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2022-2-17 07:44:46 | 只看该作者 Only view this author
wolfli369 发表于 2022-2-16 20:41
没看到全部输入文件。应该是mpi导致内存泄漏,曾在intel2019上遇到这样的问题,换了intel2018的就没事了。

谢谢您,昨晚在论坛里收到了方法,装了mpi2015就好了

240

帖子

1

威望

4039

eV
积分
4299

Level 6 (一方通行)

4#
发表于 Post on 2022-2-17 11:09:16 | 只看该作者 Only view this author
静哥哥 发表于 2022-2-17 07:44
谢谢您,昨晚在论坛里收到了方法,装了mpi2015就好了

63

帖子

0

威望

223

eV
积分
287

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2022-2-17 11:12:56 | 只看该作者 Only view this author

您好,请问遇到过这个问题吗,VASP力没有达到收敛标准,就提示已经达到了收敛精度,并且停止了,我刚发了个帖子,能不能麻烦您帮忙看看

240

帖子

1

威望

4039

eV
积分
4299

Level 6 (一方通行)

6#
发表于 Post on 2022-2-17 11:22:31 | 只看该作者 Only view this author
静哥哥 发表于 2022-2-17 11:12
您好,请问遇到过这个问题吗,VASP力没有达到收敛标准,就提示已经达到了收敛精度,并且停止了,我刚发了 ...

vasp通常力比能量更难收敛,只要向着收敛方向走,调整收敛方式继续跑就行了。

63

帖子

0

威望

223

eV
积分
287

Level 3 能力者

7#
 楼主 Author| 发表于 Post on 2022-2-17 11:24:03 | 只看该作者 Only view this author
wolfli369 发表于 2022-2-17 11:22
vasp通常力比能量更难收敛,只要向着收敛方向走,调整收敛方式继续跑就行了。

请问怎么调整收敛方式?我不太明白,按理说一个简单我晶胞应该很好收敛才对

240

帖子

1

威望

4039

eV
积分
4299

Level 6 (一方通行)

8#
发表于 Post on 2022-2-17 11:38:54 | 只看该作者 Only view this author
静哥哥 发表于 2022-2-17 11:24
请问怎么调整收敛方式?我不太明白,按理说一个简单我晶胞应该很好收敛才对

http://bbs.keinsci.com/thread-11126-1-1.htmlhttp://bbs.keinsci.com/thread-7312-1-1.html

63

帖子

0

威望

223

eV
积分
287

Level 3 能力者

9#
 楼主 Author| 发表于 Post on 2022-2-17 13:48:11 | 只看该作者 Only view this author
wolfli369 发表于 2022-2-17 11:38
http://bbs.keinsci.com/thread-11126-1-1.html和http://bbs.keinsci.com/thread-7312-1-1.html

好的, 我试试,十分感谢

1

帖子

0

威望

19

eV
积分
20

Level 1 能力者

10#
发表于 Post on 2022-4-25 16:58:03 | 只看该作者 Only view this author
静哥哥 发表于 2022-2-17 07:44
谢谢您,昨晚在论坛里收到了方法,装了mpi2015就好了

是intel2015还是mpi哪个版本呀

63

帖子

0

威望

223

eV
积分
287

Level 3 能力者

11#
 楼主 Author| 发表于 Post on 2022-4-27 17:42:09 | 只看该作者 Only view this author
HAHAHAHA 发表于 2022-4-25 16:58
是intel2015还是mpi哪个版本呀

mpi2015.tar.gz,百度一下就知道了。其实就是mpi需要用久一点的版本。

2

帖子

0

威望

9

eV
积分
11

Level 1 能力者

12#
发表于 Post on 2025-10-31 21:19:41 | 只看该作者 Only view this author
静哥哥 发表于 2022-4-27 17:42
mpi2015.tar.gz,百度一下就知道了。其实就是mpi需要用久一点的版本。

请问是把intel2019的mpi换成2015版的mpi吗,之前的intel2019mpi需要删掉吗,求助mpi2015的压缩包

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-1-24 05:42 , Processed in 0.273687 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list