计算化学公社

标题: orca的SCF HESSIAN计算报错求助 [打印本页]

作者
Author:
hanshan    时间: 2020-5-20 10:03
标题: orca的SCF HESSIAN计算报错求助
请问大神能不能指点迷津?@sobereva
计算节点内存128G,orca输入文件inp为
! B3LYP D3 def2-TZVP def2/J RIJCOSX Opt Freq tightSCF grid4 gridx4 autostart miniprint
%maxcore 10240
%pal nprocs  32 end

报错信息如下
-------------------------------------------------------------------------------
                               ORCA SCF HESSIAN
-------------------------------------------------------------------------------

Hessian of the Kohn-Sham DFT energy:
Kohn-Sham wavefunction type                      ... RKS
Hartree-Fock exchange scaling                    ...    0.200
Number of operators                              ...    1
Number of atoms                                  ...   74
Basis set dimensions                             ... 1644
Integral neglect threshold                       ... 2.5e-11
Integral primitive cutoff                        ... 2.5e-12

Setting up DFT Hessian calculations              ...
Electron density on the grid                     ... found on disk
Electron density on the final grid               ... found on disk
XC-Kernel on the grid                            ... found on disk
Building xc-kernel on the final grid             ... done   (      0.2 sec)
-------------------------------------------------------
Primary job  terminated normally, but 1 process returned
a non-zero exit code.. Per user-direction, the job has been aborted.
-------------------------------------------------------
--------------------------------------------------------------------------
mpirun detected that one or more processes exited with non-zero status, thus causing
the job to be terminated. The first process to do so was:

  Process name: [[32027,1],23]
  Exit code:    64
--------------------------------------------------------------------------

ORCA finished by error termination in SCF Hessian
Calling Command: mpirun -np 32  /home/bin/orca_4_1_2_linux_x86-64_openmpi215/orca_scfhess_mpi 4n1.scfhess.inp 4n1
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run


作者
Author:
hanshan    时间: 2020-5-20 10:05
对了,还有一个报错信息
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!                        FATAL ERROR ENCOUNTERED               !!!
!!!                        -----------------------               !!!
!!!                          I/O OPERATION FAILED                !!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

作者
Author:
ChrisZheng    时间: 2020-5-20 10:14
%maxcore 10240
这个内存是每个核的内存使用,每个核10G内存

%pal nprocs  32 end
你使用32个核,总共需要320G。

作者
Author:
hanshan    时间: 2020-5-20 10:15
ChrisZheng 发表于 2020-5-20 10:14
%maxcore 10240
这个内存是每个核的内存使用,每个核10G内存

谢谢,我之前觉得这个是设置内存上限
作者
Author:
ChrisZheng    时间: 2020-5-20 10:28
本帖最后由 ChrisZheng 于 2020-5-20 10:29 编辑
hanshan 发表于 2020-5-20 10:05
对了,还有一个报错信息
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!    ...

这个IO错误可能是和你输入坐标有问题 比如这样写

  1. ....
  2. * xyzfile 0 1 a.xyz
复制代码


最后不跟一个空行 ORCA会错误的读取文件名 报IO错误 正确的写法是这样


  1. ....
  2. * xyzfile 0 1 a.xyz

复制代码

留至少一个空行 论坛里格式不太好实现


作者
Author:
hanshan    时间: 2020-5-20 10:38
ChrisZheng 发表于 2020-5-20 10:28
这个IO错误可能是和你输入坐标有问题 比如这样写

计算几个小时之后到hessian时候报错的,坐标可能没有问题
作者
Author:
sobereva    时间: 2020-5-20 22:43
先把内存设置不当问题解决了再说
作者
Author:
hanshan    时间: 2020-5-25 09:14
sobereva 发表于 2020-5-20 22:43
先把内存设置不当问题解决了再说

内存设置已经改了,还是完全一样的报错
作者
Author:
rabbitkiller    时间: 2020-5-25 09:54
hanshan 发表于 2020-5-25 09:14
内存设置已经改了,还是完全一样的报错

"mpirun detected that one or more processes exited with non-zero status, thus causing
the job to be terminated. The first process to do so was:"

貌似是程序计算过程中出问题了。Hessian计算内存消耗很厉害,会不会是因为内存消耗太大系统自动杀掉了一部分进程?你试试Numfreq看看会不会报错,Numfreq计算内存消耗小得多。

作者
Author:
hanshan    时间: 2020-5-25 11:03
rabbitkiller 发表于 2020-5-25 09:54
"mpirun detected that one or more processes exited with non-zero status, thus causing
the job to ...

Numfreq是Numerical frequency calculations
Freq是Analytical frequency calculations吧
作者
Author:
rabbitkiller    时间: 2020-5-25 11:23
hanshan 发表于 2020-5-25 11:03
Numfreq是Numerical frequency calculations
Freq是Analytical frequency calculations吧

是的,numfreq内存消耗少得多。如果真是内存不够的话,可以试试numfreq。
作者
Author:
hanshan    时间: 2020-5-25 11:28
rabbitkiller 发表于 2020-5-25 11:23
是的,numfreq内存消耗少得多。如果真是内存不够的话,可以试试numfreq。

那要是数值解而非解析解的话,是不是还不如用Gaussian算呢?本来用orca就是为了rijcosx加速
作者
Author:
rabbitkiller    时间: 2020-5-25 12:14
hanshan 发表于 2020-5-25 11:28
那要是数值解而非解析解的话,是不是还不如用Gaussian算呢?本来用orca就是为了rijcosx加速

我也是新手,也遇到过类似问题 后来试了试numfreq,算是能算,太慢了。

我记得freq的设置里面有一个dryrun,是估计运行所需最大内存的,你翻翻手册,试试看用dryrun估计一下内存。
作者
Author:
chenw    时间: 2020-6-12 22:36
楼主问题解决了吗?我也遇到了类似的困惑
作者
Author:
jliang    时间: 2020-7-16 16:00
楼主问题解决了吗?我也遇到了类似的困惑

作者
Author:
隔壁很辣    时间: 2021-9-15 09:57
我也遇到了这样的问题,把内存分配提高了两倍之后是可以解决的。
作者
Author:
j5888xm    时间: 2023-9-8 20:33
本帖最后由 j5888xm 于 2023-9-8 20:38 编辑

算了几个小时这个不是MPI的问题,减少核数加大内存可以解决




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3