计算化学公社

标题: ORCA DLPNO-CCSD(T)单点报错求助 [打印本页]

作者
Author:
量子极限    时间: 2021-5-24 10:17
标题: ORCA DLPNO-CCSD(T)单点报错求助
我用的版本是ORCA 4.2.1,ORCA输入文件为参考文献提供的orca输入文件修改的,我只修改了%maxcore 6000 和%pal nprocs  4 其他没有改动。服务器是28核 56G内存.
这是我的输入文件:
! DLPNO-CCSD(T) verytightscf def2-tzvp def2/JK def2-tzvp/C RIJCOSX gridx7 LED
%maxcore  6000
%pal nprocs   4 end
%basis aux "def2/jk" end
%mdci
TCutPairs 1e-5
PrintLevel 3
End
* xyz   0   1
坐标
*

报错信息如下:
--------------------------------
LOCAL RI TRANSFORMATION (VABPAO)
--------------------------------

Number of PAOs:    3246
Basis functions:   3246 (1290 shells)
Aux. functions:    8024 (2512 shells)

Processing maps (0.1 sec)
Average map sizes:
   Aux shells -> PAOs           2730.0
   PAOs       -> AO shells      1215.9

Calculating integrals Error in AddMatrix: Failed to add 1176 0 to Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8.VABPAO.tmp.proc0

ORCA finished by error termination in MDCI
Calling Command: mpirun -np 4  -machinefile Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8.nodes /public/sourcecode/orca_4_2_1_linux_x86-64_openmpi314/orca_mdci_mpi Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8.mdciinp.tmp Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run



想请教一下大家,这可能是哪里出现问题,应该怎么处理
谢谢大家


作者
Author:
量子极限    时间: 2021-5-24 10:19
相同的设置,我将输入文件中的verytightscf修改为tightscf,报错信息变为:
PNO truncation parameters                   ....
    PAOOverlapThresh   =        1.000e-08

    TCutPairs          =        1.000e-05
    TCutPNO            =        3.330e-07
    TCutPNOSingles     =        9.990e-09
    TCutMP2Pairs       =        1.000e-06
    TCutMKN            =        1.000e-03
    TCutDO             =        1.000e-02

Pair selection                          .... not used
Type of local MP2 treatment                 .... semi-local MP2
Strategy for PNO selection                  .... occupation number selection
Pair density normalization                  .... MP2 norm
Spin component scaling                      .... not used

[file orca_tools/Tool-Parallel/pal1.cpp, line 2741, Process 2]: Error in PAL_fseek

[file orca_tools/Tool-Parallel/pal1.cpp, line 2741, Process 3]: Error in PAL_fseek


ORCA finished by error termination in MDCI
Calling Command: mpirun -np 4  -machinefile Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-9.nodes /public/sourcecode/orca_4_2_1_linux_x86-64_openmpi314/orca_mdci_mpi Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-9.mdciinp.tmp Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-9
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run

请教一下各位老师应该怎么解决这个报错呢,谢谢各位大佬
作者
Author:
wzkchem5    时间: 2021-5-24 17:41
量子极限 发表于 2021-5-24 03:19
相同的设置,我将输入文件中的verytightscf修改为tightscf,报错信息变为:
PNO truncation parameters    ...

硬盘空间不足。
腾空一下硬盘,或者换用一个比较大的硬盘。如果还不行,可以考虑改用HFLD等近似一些的方法
作者
Author:
量子极限    时间: 2021-5-27 16:43
wzkchem5 发表于 2021-5-24 17:41
硬盘空间不足。
腾空一下硬盘,或者换用一个比较大的硬盘。如果还不行,可以考虑改用HFLD等近似一些的方 ...

好的,谢谢大佬,我都试一下看看
作者
Author:
量子极限    时间: 2021-6-25 14:10
试了一下降低PrintLevel到2以及使用关键词cfloat压缩储存还是不可,这是更新过后的错误输出文件。现在组里打算买硬盘,请问各位大佬有知道orca有什么关键词可以显示或者计算整个任务如果正常算完需要的硬盘空间大小的吗?

作者
Author:
zjxitcc    时间: 2021-6-25 14:54
量子极限 发表于 2021-6-25 14:10
试了一下降低PrintLevel到2以及使用关键词cfloat压缩储存还是不可,这是更新过后的错误输出文件。现在组里 ...

(1)如果是硬盘满了,计算中断后执行df -h可以看到是哪个分区满了,依此验证确实是硬盘满了。
(2)PrintLevel是调整输出文件的打印多少,这才几KB,显然不影响硬盘满不满;你硬盘满了那是因为ORCA临时文件写满的,不是因为输出文件满的。
(3)你的标题是DLPNO-CCSD(T)单点,因此认为你想算的仅仅是DLPNO-CCSD(T)单点能,这是不需要加LED的,LED是用来分解DLPNO-CCSD(T)能量的。
(4)写了RIJCOSX gridx7,讲道理是用不到def2/JK的,因为与此无关,不过这不是关键问题就是了。
作者
Author:
shalene    时间: 2021-6-25 15:12
Basis functions:   3246
%maxcore 6000 这点内存百分之白不够

作者
Author:
zjxitcc    时间: 2021-6-25 15:23
shalene 发表于 2021-6-25 15:12
Basis functions:   3246
%maxcore 6000 这点内存百分之白不够

他这估计内存、硬盘都不够。内存差的太远了,总内存没500GB以上估计做不了。
作者
Author:
量子极限    时间: 2021-6-25 15:56
本帖最后由 量子极限 于 2021-6-25 16:29 编辑
zjxitcc 发表于 2021-6-25 15:23
他这估计内存、硬盘都不够。内存差的太远了,总内存没500GB以上估计做不了。

感谢两位大佬详细的解答!我试一下尽可能的加大内存测试一下,如果任务中断还是这个报错并且检查硬盘满了应该就是硬盘的问题了,不知道8T的硬盘够不够算这个任务。。。
作者
Author:
shalene    时间: 2021-6-25 20:33
zjxitcc 发表于 2021-6-25 15:23
他这估计内存、硬盘都不够。内存差的太远了,总内存没500GB以上估计做不了。

确实
作者
Author:
shalene    时间: 2021-6-25 20:45
本帖最后由 shalene 于 2021-6-25 20:48 编辑

估计你的硬件完不成这个任务。给你个参考:2088 basis functions, maxcore设为12000MB, normalPNO。 实际内存消耗10XXXMB,硬盘最大消耗300+GB。

dlpno-ccsd可是ON^6
作者
Author:
量子极限    时间: 2021-7-12 10:29
shalene 发表于 2021-6-25 20:45
估计你的硬件完不成这个任务。给你个参考:2088 basis functions, maxcore设为12000MB, normalPNO。 实际内 ...

是的,的确完不成。组里更新设备,把内存拓展到120GB,文件比之前的往前更多算了几步,显示算完IJPairs 差不多要900000 MB的内存,只能找专业的超算平台算了。请问各位大佬知道有可以提供1T及以上内存的超算平台吗?目前我只知道并行超算云有提供这样的服务。
Max core memory to be used                    ...  60000 MB
Number of batches needed                      ...     16
Average Memory used per batch                 ...  56247 MB
Pair Pair terms per batch                     ...  16343
Total number of pairs                         ...   6602
Memory needed for all IJPairs                 ... 899956 MB
   IBatch   1 (of  16)              ... done ( 4670.660 sec)
   IBatch   2 (of  16)              ... done ( 5146.417 sec)
   IBatch   3 (of  16)              ... done ( 5453.892 sec)
   IBatch   4 (of  16)              ... done ( 6216.353 sec)
   IBatch   5 (of  16)              ... done ( 6250.941 sec)
   IBatch   6 (of  16)              ... done ( 6244.062 sec)
   IBatch   7 (of  16)              ... done ( 6431.288 sec)
   IBatch   8 (of  16)              ... done ( 6601.764 sec)
   IBatch   9 (of  16)              ... done ( 6869.246 sec)
   IBatch  10 (of  16)              ... done ( 7350.735 sec)
   IBatch  11 (of  16)              ... done ( 8098.185 sec)
   IBatch  12 (of  16)              ... done ( 9089.518 sec)
   IBatch  13 (of  16)              ... done (10725.542 sec)
   IBatch  14 (of  16)              ... done (13138.085 sec)
   IBatch  15 (of  16)              ...
ORCA finished by error termination in MDCI
作者
Author:
zjxitcc    时间: 2021-7-12 10:36
本帖最后由 zjxitcc 于 2021-7-12 13:16 编辑
量子极限 发表于 2021-7-12 10:29
是的,的确完不成。组里更新设备,把内存拓展到120GB,文件比之前的往前更多算了几步,显示算完IJPairs  ...

如果你的体系本身比较大,适合用CIM-DLPNO-CCSD(T)方法,这是两种线性标度方法CIM与DLPNO二者的结合,其精度仍接近DLPNO-CCSD(T)。原版的CIM-DLPNO-CCSD(T)从ORCA 4开始就有了。加了distant pair correction后更准,但是加了校正的版本还未在ORCA 5.0.0里。你可以找@niobium 合作(jsnzg@163.com),他是CIM-DLPNO-CCSD(T)加了distant pair correction的开发者,这个新版能量更准。

PS1:这是CIM-DLPNO-CCSD(T)加了distant pair correction的文献https://pubs.acs.org/doi/10.1021/acs.jctc.0c00831
PS2:CIM-DLPNO-CCSD(T)可以算能量,但是做LED目前应该是不行的。

作者
Author:
biogon    时间: 2021-7-12 12:04
zjxitcc 发表于 2021-7-12 10:36
如果你的体系本身比较大,适合用CIM-DLPNO-CCSD(T)方法,这是两种线性标度方法CIM与DLPNO二者的结合,其 ...

CIM-DLPNO-CCSD(T)我看5.0手册里不是提到了有的么
作者
Author:
zjxitcc    时间: 2021-7-12 13:16
biogon 发表于 2021-7-12 12:04
CIM-DLPNO-CCSD(T)我看5.0手册里不是提到了有的么

我修改了13L的表述。
作者
Author:
量子极限    时间: 2021-7-14 14:27
本帖最后由 量子极限 于 2021-7-14 14:29 编辑
zjxitcc 发表于 2021-7-12 10:36
如果你的体系本身比较大,适合用CIM-DLPNO-CCSD(T)方法,这是两种线性标度方法CIM与DLPNO二者的结合,其 ...

感谢两位老师的解答,目前是已经找到了合适的超算(2TB或3TB的内存,硬盘几TB大小)能算这个较大的体系。主要是参考一篇比较相关的文献,学习并按照他的方法来做的benchmark,所以方法也不太方便改,如果最后还是不行的话可能试一下CIM-DLPNO-CCSD(T)加校正的方法。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3