计算化学公社

标题: 求助orca计算单点能报错:ORCA finished by error termination in MDCI [打印本页]

作者
Author:
hhwang    时间: 2021-5-8 11:46
标题: 求助orca计算单点能报错:ORCA finished by error termination in MDCI
本帖最后由 hhwang 于 2021-5-8 11:46 编辑

各位老师,我尝试通过http://sobereva.com/490中的高精度方法12 Approximated CCSD(T)/CBS with help of MP2 (cc-pVTZ->QZ extrapolation)
13 CCSD(T)/CBS (cc-pVTZ->QZ extrapolation)
DLPNO-CCSD(T)/CBS with tightPNO and RIJK (def2-TZVPP->QZVPP extrapolation)
这三种方法作为orca输入方法计算当前的体系,在计算H2O、CH4等小分子的时候可以正常结束,但是在处理反应物、过渡态和产物时均出现ORCA finished by error termination in MDCI 错误,之前的提醒是内存不足,尝试通过 %maxcore 102400 将内存增加到100GB,还是不能正常结束,下面是采用DLPNO-CCSD(T)/CBS方法的输入文件4TS5-TS5.inp,作业提交脚本4TS5-TS5.slurm,和输出文件4TS5-TS5.out希望能得到各位老师们的指导,找到解决方法。
谢谢老师们!



作者
Author:
zjxitcc    时间: 2021-5-8 13:23
%maxcore不是总内存,是每核内存。这样的话你的%maxcore乘核数 不得超过机器可用内存。
作者
Author:
hhwang    时间: 2021-5-8 19:37
zjxitcc 发表于 2021-5-8 13:23
%maxcore不是总内存,是每核内存。这样的话你的%maxcore乘核数 不得超过机器可用内存。

老师,我计算了一下,每核内存设置成100GB确实有点过大了,因为之前计算高斯作业的时候都是核数40,内存50GB,我之前用 %maxcore 51200测试过也出错了,按照您的建议,改成了61440仍然出现了同样的错误,是不是因为方法的精度太高,加上体系有6个重原子,所以才不能正常结束?请问老师上面提到的这三种orca的高精度外推方法做单点能计算时可以计算多大的体系呢?
作者
Author:
RAL    时间: 2021-5-8 20:03
ORCA内存管理不太好,所以给的%maxcore乘核数的总数要略低于机器总内存,比如80%。如果还是炸内存,就要降低核数或者干脆换个大内存机器。
你这个体系挺小的,当前方法应该算得动。
作者
Author:
zjxitcc    时间: 2021-5-8 20:04
hhwang 发表于 2021-5-8 19:37
老师,我计算了一下,每核内存设置成100GB确实有点过大了,因为之前计算高斯作业的时候都是核数40,内存5 ...

你可以选择不用外推,你在1L的文件里有DLPNO-CCSD(T)/def2-TZVPP结果,可以直接使用。任务是在算def2-QZVPP时挂掉的,不妨碍前面def2-TZVPP算完了。
作者
Author:
wzkchem5    时间: 2021-5-8 20:15
hhwang 发表于 2021-5-8 12:37
老师,我计算了一下,每核内存设置成100GB确实有点过大了,因为之前计算高斯作业的时候都是核数40,内存5 ...

补充一下,如果不做外推,可以考虑用F12代替
作者
Author:
hhwang    时间: 2021-5-8 21:25
RAL 发表于 2021-5-8 20:03
ORCA内存管理不太好,所以给的%maxcore乘核数的总数要略低于机器总内存,比如80%。如果还是炸内存,就要降 ...

因为作业是在超算上提交的,cup单个节点最小核数是40,总内存应该是在3T,内存设置到60G差不多算是内存空间的80%,所以不知道出错的原因
作者
Author:
zjxitcc    时间: 2021-5-8 21:29
hhwang 发表于 2021-5-8 21:25
因为作业是在超算上提交的,cup单个节点最小核数是40,总内存应该是在3T,内存设置到60G差不多算是内存空 ...

我看你输入文件里压根没写核数啊,那就是单核在跑哇
作者
Author:
hhwang    时间: 2021-5-8 21:48
zjxitcc 发表于 2021-5-8 20:04
你可以选择不用外推,你在1L的文件里有DLPNO-CCSD(T)/def2-TZVPP结果,可以直接使用。任务是在算def2-QZV ...

老师,输出文件的Extrapolated Energy 2 Basis=  def2-QZVPP上面有一个
E(CCSD(T))                                 ...   -272.317384009
文件的最后还有一个
E(CCSD(T))                                 ...   -272.396172096
我在提取DLPNO-CCSD(T)/def2-TZVPP结果的时候应该用哪个E(CCSD(T)) 能量呀?
作者
Author:
hhwang    时间: 2021-5-8 21:58
wzkchem5 发表于 2021-5-8 20:15
补充一下,如果不做外推,可以考虑用F12代替

嗯嗯,老师,我还用了DLPNO-CCSD(T) normalPNO RIJK cc-pVTZ cc-pVTZ/JK cc-pVTZ/C tightSCF noautostart miniprint nopop这种方法,可以正常结束,尝试orca外推的方法,主要是想把上面的外推计算和高斯的CCSD(T)/CBS tz-qz外推对比一下结果,但是orca外推的单点计算一直出现错误
作者
Author:
wzkchem5    时间: 2021-5-8 22:04
hhwang 发表于 2021-5-8 14:58
嗯嗯,老师,我还用了DLPNO-CCSD(T) normalPNO RIJK cc-pVTZ cc-pVTZ/JK cc-pVTZ/C tightSCF noautostart ...

我现在才打开你的输出文件看,在这里报错应该不是内存/硬盘不足。
stderr有输出任何信息吗?
作者
Author:
hhwang    时间: 2021-5-8 22:09
zjxitcc 发表于 2021-5-8 21:29
我看你输入文件里压根没写核数啊,那就是单核在跑哇

因为之前的DLPNO-CCSD(T) normalPNO RIJK cc-pVTZ cc-pVTZ/JK cc-pVTZ/C tightSCF noautostart miniprint nopop方法输入文件里没有写核数和内存,在提交命令的脚本.slurm里写了#SBATCH -n 40   #SBATCH --ntasks-per-node=40,我以为这样就可以了,后来计算外推方法出错了,就在里面加上了内存,没有加核数信息,老师,你的意思是orca输入文件里也必须指定核数吗?
作者
Author:
zjxitcc    时间: 2021-5-8 22:12
hhwang 发表于 2021-5-8 22:09
因为之前的DLPNO-CCSD(T) normalPNO RIJK cc-pVTZ cc-pVTZ/JK cc-pVTZ/C tightSCF noautostart miniprint ...

是的。
作者
Author:
hhwang    时间: 2021-5-8 22:12
wzkchem5 发表于 2021-5-8 22:04
我现在才打开你的输出文件看,在这里报错应该不是内存/硬盘不足。
stderr有输出任何信息吗?

老师,你说的stderr是什么呀?下面这个是伴随着作业提交的6006331.err文件,里面错误信息是这样的:
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run

/tmp/slurmd/job6006331/slurm_script: line 11: 99300 Segmentation fault      /lustre/home/acct-mezzy/mezzy/SOFTWARE/Orca/orca_4_2_1_linux_x86-64_shared_openmpi314/orca 4TS5-TS5.inp > 4TS5-TS5.out
作者
Author:
hhwang    时间: 2021-5-8 22:38
zjxitcc 发表于 2021-5-8 22:12
是的。

嗯嗯,好的,我已经把核数加进去重新提交了
作者
Author:
hhwang    时间: 2021-5-8 23:10
zjxitcc 发表于 2021-5-8 22:12
是的。

刚开始学习orca,出现了算是很低级的错误,谢谢您和其他各位老师,输入文件中加上核数命令之后可以正常结束了
作者
Author:
wzkchem5    时间: 2021-5-9 00:03
hhwang 发表于 2021-5-8 15:12
老师,你说的stderr是什么呀?下面这个是伴随着作业提交的6006331.err文件,里面错误信息是这样的:
[fi ...

就是你贴的这个。
感觉可能是orca的一个bug,建议在orca论坛上发个帖,报一下bug
作者
Author:
hhwang    时间: 2021-5-9 18:50
wzkchem5 发表于 2021-5-9 00:03
就是你贴的这个。
感觉可能是orca的一个bug,建议在orca论坛上发个帖,报一下bug

谢谢老师的建议,主要是orca刚接触没多久,没办法识别是自己的问题还是软件的问题
作者
Author:
余墨清秋    时间: 2022-6-11 00:56
hhwang 发表于 2021-5-8 23:10
刚开始学习orca,出现了算是很低级的错误,谢谢您和其他各位老师,输入文件中加上核数命令之后可以正常结 ...

请问你当时核数的语句是怎么加的?我遇到了和你同样的问题,但一加核数和end就报并行命令的错误
作者
Author:
wzkchem5    时间: 2022-6-11 01:40
余墨清秋 发表于 2022-6-10 17:56
请问你当时核数的语句是怎么加的?我遇到了和你同样的问题,但一加核数和end就报并行命令的错误

这个一般是openmpi没装对,或者环境变量(PATH、LD_LIBRARY_PATH)没设对,不是输入文件没写对。
作者
Author:
余墨清秋    时间: 2022-6-11 09:40
wzkchem5 发表于 2022-6-11 01:40
这个一般是openmpi没装对,或者环境变量(PATH、LD_LIBRARY_PATH)没设对,不是输入文件没写对。

好的,谢谢




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3