计算化学公社

标题: ORCA DLPNO-CCSD(T)单点报错求助 [打印本页]

作者
Author: 量子极限 时间: 2021-5-24 10:17
标题: ORCA DLPNO-CCSD(T)单点报错求助
我用的版本是ORCA 4.2.1，ORCA输入文件为参考文献提供的orca输入文件修改的，我只修改了%maxcore 6000 和%pal nprocs  4 其他没有改动。服务器是28核 56G内存.
这是我的输入文件：
! DLPNO-CCSD(T) verytightscf def2-tzvp def2/JK def2-tzvp/C RIJCOSX gridx7 LED
%maxcore  6000
%pal nprocs 4 end
%basis aux "def2/jk" end
%mdci
TCutPairs 1e-5
PrintLevel 3
End
* xyz 0 1
坐标
*

报错信息如下：
--------------------------------
LOCAL RI TRANSFORMATION (VABPAO)
--------------------------------

Number of PAOs: 3246
Basis functions: 3246 (1290 shells)
Aux. functions: 8024 (2512 shells)

Processing maps (0.1 sec)
Average map sizes:
Aux shells -> PAOs          2730.0
PAOs    -> AO shells    1215.9

Calculating integrals Error in AddMatrix: Failed to add 1176 0 to Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8.VABPAO.tmp.proc0

ORCA finished by error termination in MDCI
Calling Command: mpirun -np 4  -machinefile Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8.nodes /public/sourcecode/orca_4_2_1_linux_x86-64_openmpi314/orca_mdci_mpi Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8.mdciinp.tmp Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-8
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run

想请教一下大家，这可能是哪里出现问题，应该怎么处理
谢谢大家

作者
Author: 量子极限 时间: 2021-5-24 10:19
相同的设置，我将输入文件中的verytightscf修改为tightscf，报错信息变为：
PNO truncation parameters                ....
PAOOverlapThresh =       1.000e-08

TCutPairs       =       1.000e-05
TCutPNO          =       3.330e-07
TCutPNOSingles    =       9.990e-09
TCutMP2Pairs    =       1.000e-06
TCutMKN          =       1.000e-03
TCutDO          =       1.000e-02

Pair selection                         .... not used
Type of local MP2 treatment                .... semi-local MP2
Strategy for PNO selection                .... occupation number selection
Pair density normalization                .... MP2 norm
Spin component scaling                   .... not used

[file orca_tools/Tool-Parallel/pal1.cpp, line 2741, Process 2]: Error in PAL_fseek

[file orca_tools/Tool-Parallel/pal1.cpp, line 2741, Process 3]: Error in PAL_fseek

ORCA finished by error termination in MDCI
Calling Command: mpirun -np 4  -machinefile Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-9.nodes /public/sourcecode/orca_4_2_1_linux_x86-64_openmpi314/orca_mdci_mpi Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-9.mdciinp.tmp Cat_MA-TS_Major_degree-thred-10_1_TS_CCSD-9
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run

请教一下各位老师应该怎么解决这个报错呢，谢谢各位大佬

作者
Author: wzkchem5 时间: 2021-5-24 17:41

量子极限发表于 2021-5-24 03:19
相同的设置，我将输入文件中的verytightscf修改为tightscf，报错信息变为：
PNO truncation parameters ...

硬盘空间不足。
腾空一下硬盘，或者换用一个比较大的硬盘。如果还不行，可以考虑改用HFLD等近似一些的方法

作者
Author: 量子极限 时间: 2021-5-27 16:43

wzkchem5 发表于 2021-5-24 17:41
硬盘空间不足。
腾空一下硬盘，或者换用一个比较大的硬盘。如果还不行，可以考虑改用HFLD等近似一些的方 ...

好的，谢谢大佬，我都试一下看看

作者
Author: 量子极限 时间: 2021-6-25 14:10
试了一下降低PrintLevel到2以及使用关键词cfloat压缩储存还是不可，这是更新过后的错误输出文件。现在组里打算买硬盘，请问各位大佬有知道orca有什么关键词可以显示或者计算整个任务如果正常算完需要的硬盘空间大小的吗？

作者
Author: zjxitcc 时间: 2021-6-25 14:54

量子极限发表于 2021-6-25 14:10
试了一下降低PrintLevel到2以及使用关键词cfloat压缩储存还是不可，这是更新过后的错误输出文件。现在组里 ...

（1）如果是硬盘满了，计算中断后执行df -h可以看到是哪个分区满了，依此验证确实是硬盘满了。
（2）PrintLevel是调整输出文件的打印多少，这才几KB，显然不影响硬盘满不满；你硬盘满了那是因为ORCA临时文件写满的，不是因为输出文件满的。
（3）你的标题是DLPNO-CCSD(T)单点，因此认为你想算的仅仅是DLPNO-CCSD(T)单点能，这是不需要加LED的，LED是用来分解DLPNO-CCSD(T)能量的。
（4）写了RIJCOSX gridx7，讲道理是用不到def2/JK的，因为与此无关，不过这不是关键问题就是了。

作者
Author: shalene 时间: 2021-6-25 15:12
Basis functions: 3246
%maxcore 6000 这点内存百分之白不够

作者
Author: zjxitcc 时间: 2021-6-25 15:23

shalene 发表于 2021-6-25 15:12
Basis functions: 3246
%maxcore 6000 这点内存百分之白不够

他这估计内存、硬盘都不够。内存差的太远了，总内存没500GB以上估计做不了。

作者
Author: 量子极限 时间: 2021-6-25 15:56
本帖最后由量子极限于 2021-6-25 16:29 编辑

zjxitcc 发表于 2021-6-25 15:23
他这估计内存、硬盘都不够。内存差的太远了，总内存没500GB以上估计做不了。

感谢两位大佬详细的解答！我试一下尽可能的加大内存测试一下，如果任务中断还是这个报错并且检查硬盘满了应该就是硬盘的问题了，不知道8T的硬盘够不够算这个任务。。。

作者
Author: shalene 时间: 2021-6-25 20:33

zjxitcc 发表于 2021-6-25 15:23
他这估计内存、硬盘都不够。内存差的太远了，总内存没500GB以上估计做不了。

确实

作者
Author: shalene 时间: 2021-6-25 20:45
本帖最后由 shalene 于 2021-6-25 20:48 编辑

估计你的硬件完不成这个任务。给你个参考:2088 basis functions, maxcore设为12000MB, normalPNO。实际内存消耗10XXXMB，硬盘最大消耗300+GB。

dlpno-ccsd可是ON^6

作者
Author: 量子极限 时间: 2021-7-12 10:29

shalene 发表于 2021-6-25 20:45
估计你的硬件完不成这个任务。给你个参考:2088 basis functions, maxcore设为12000MB, normalPNO。实际内 ...

是的，的确完不成。组里更新设备，把内存拓展到120GB，文件比之前的往前更多算了几步，显示算完IJPairs 差不多要900000 MB的内存，只能找专业的超算平台算了。请问各位大佬知道有可以提供1T及以上内存的超算平台吗？目前我只知道并行超算云有提供这样的服务。
Max core memory to be used                   ...  60000 MB
Number of batches needed                   ...    16
Average Memory used per batch                ...  56247 MB
Pair Pair terms per batch                   ...  16343
Total number of pairs                      ... 6602
Memory needed for all IJPairs                ... 899956 MB
IBatch 1 (of  16)             ... done ( 4670.660 sec)
IBatch 2 (of  16)             ... done ( 5146.417 sec)
IBatch 3 (of  16)             ... done ( 5453.892 sec)
IBatch 4 (of  16)             ... done ( 6216.353 sec)
IBatch 5 (of  16)             ... done ( 6250.941 sec)
IBatch 6 (of  16)             ... done ( 6244.062 sec)
IBatch 7 (of  16)             ... done ( 6431.288 sec)
IBatch 8 (of  16)             ... done ( 6601.764 sec)
IBatch 9 (of  16)             ... done ( 6869.246 sec)
IBatch  10 (of  16)             ... done ( 7350.735 sec)
IBatch  11 (of  16)             ... done ( 8098.185 sec)
IBatch  12 (of  16)             ... done ( 9089.518 sec)
IBatch  13 (of  16)             ... done (10725.542 sec)
IBatch  14 (of  16)             ... done (13138.085 sec)
IBatch  15 (of  16)             ...
ORCA finished by error termination in MDCI

作者
Author: zjxitcc 时间: 2021-7-12 10:36
本帖最后由 zjxitcc 于 2021-7-12 13:16 编辑

量子极限发表于 2021-7-12 10:29
是的，的确完不成。组里更新设备，把内存拓展到120GB，文件比之前的往前更多算了几步，显示算完IJPairs ...

如果你的体系本身比较大，适合用CIM-DLPNO-CCSD(T)方法，这是两种线性标度方法CIM与DLPNO二者的结合，其精度仍接近DLPNO-CCSD(T)。原版的CIM-DLPNO-CCSD(T)从ORCA 4开始就有了。加了distant pair correction后更准，但是加了校正的版本还未在ORCA 5.0.0里。你可以找@niobium 合作（jsnzg@163.com），他是CIM-DLPNO-CCSD(T)加了distant pair correction的开发者，这个新版能量更准。

PS1：这是CIM-DLPNO-CCSD(T)加了distant pair correction的文献https://pubs.acs.org/doi/10.1021/acs.jctc.0c00831
PS2：CIM-DLPNO-CCSD(T)可以算能量，但是做LED目前应该是不行的。

作者
Author: biogon 时间: 2021-7-12 12:04

zjxitcc 发表于 2021-7-12 10:36
如果你的体系本身比较大，适合用CIM-DLPNO-CCSD(T)方法，这是两种线性标度方法CIM与DLPNO二者的结合，其 ...

CIM-DLPNO-CCSD(T)我看5.0手册里不是提到了有的么

作者
Author: zjxitcc 时间: 2021-7-12 13:16

biogon 发表于 2021-7-12 12:04
CIM-DLPNO-CCSD(T)我看5.0手册里不是提到了有的么

我修改了13L的表述。

作者
Author: 量子极限 时间: 2021-7-14 14:27
本帖最后由量子极限于 2021-7-14 14:29 编辑

zjxitcc 发表于 2021-7-12 10:36
如果你的体系本身比较大，适合用CIM-DLPNO-CCSD(T)方法，这是两种线性标度方法CIM与DLPNO二者的结合，其 ...

感谢两位老师的解答，目前是已经找到了合适的超算（2TB或3TB的内存，硬盘几TB大小）能算这个较大的体系。主要是参考一篇比较相关的文献，学习并按照他的方法来做的benchmark，所以方法也不太方便改，如果最后还是不行的话可能试一下CIM-DLPNO-CCSD(T)加校正的方法。

作者
Author: 413 时间: 2025-1-8 17:12

shalene 发表于 2021-6-25 20:45
估计你的硬件完不成这个任务。给你个参考:2088 basis functions, maxcore设为12000MB, normalPNO。实际内 ...

你好，请问你们当时用的机器总内存多少？
你当时跑那个作业的时候用了多少个核心数还能记得吗？

作者
Author: 菓瀛 时间: 2025-5-10 10:29
本帖最后由菓瀛于 2025-5-10 10:40 编辑

zjxitcc 发表于 2021-7-12 10:36
如果你的体系本身比较大，适合用CIM-DLPNO-CCSD(T)方法，这是两种线性标度方法CIM与DLPNO二者的结合，其 ...

老师不好意思打扰您我的体系有30个原子计算的是含能分子HMX和NO2的氢提取反应采用CIM-DLPNO-CCSD(T)方法计算单点能图1是输入文件 (, 下载次数 Times of downloads: 44) C:\Users\Administrator\Desktop\捕获2.PNG 图2是报错信息C:\Users\Administrator\Desktop\捕获.PNG (, 下载次数 Times of downloads: 43) 文件是输出文件 (, 下载次数 Times of downloads: 0) 想请教您一下这可能是哪里出现问题要如何解决呢

作者
Author: wzkchem5 时间: 2025-5-10 11:17

菓瀛发表于 2025-5-10 10:29
老师不好意思打扰您我的体系有30个原子计算的是含能分子HMX和NO2的氢提取反应采用CIM-DLPNO-CCSD(T) ...

这么小的分子没必要用CIM，只用DLPNO就行

作者
Author: 菓瀛 时间: 2025-5-10 11:25

wzkchem5 发表于 2025-5-10 11:17
这么小的分子没必要用CIM，只用DLPNO就行

谢谢老师我之前用的是DLPNO-CCSD(T)方法计算的单点能但是会报错内存不足的所以我想试一下CIM 以为它不会那么吃内存

作者
Author: wzkchem5 时间: 2025-5-10 12:23

菓瀛发表于 2025-5-10 11:25
谢谢老师我之前用的是DLPNO-CCSD(T)方法计算的单点能但是会报错内存不足的所以我想试一下CIM 以为它不 ...

报内存不足既可能是maxcore设得太小，也可能是maxcore设得太大。不要一味增大maxcore。
这个体系用一般的机子不应该算不动，如果真算不动，可以做DLPNO-CCSD(T)-F12/cc-pVTZ-F12

作者
Author: zjxitcc 时间: 2025-5-10 13:23
本帖最后由 zjxitcc 于 2025-5-10 13:37 编辑

菓瀛发表于 2025-5-10 10:29
老师不好意思打扰您我的体系有30个原子计算的是含能分子HMX和NO2的氢提取反应采用CIM-DLPNO-CCSD(T) ...

（1）体系尺寸较小，直接用DLPNO近似，无需CIM近似。减小核数，增加每核内存。
（2）由于你做的是非限制性开壳层计算，计算量比相应的闭壳层任务大得多，因此建议你基组降为cc-pVTZ，如果能够成功算出，再考虑增加精度不迟。路还是一步一步走，不宜一口气吃成胖子。如果连cc-pVTZ都算不出来，说明对于目标计算而言当前机器配置过低。
（3）由于是非限制性开壳层计算，建议分两步算：第一步做UHF单点计算，并检验波函数稳定性，确保获得了稳定的UHF波函数；第二步读取稳定的UHF波函数进行! UHF DLPNO-CCSD(T)计算。

作者
Author: 菓瀛 时间: 2025-5-10 15:08

wzkchem5 发表于 2025-5-10 12:23
报内存不足既可能是maxcore设得太小，也可能是maxcore设得太大。不要一味增大maxcore。
这个体系用一般 ...

谢谢老师的解答

作者
Author: 菓瀛 时间: 2025-5-10 15:12

zjxitcc 发表于 2025-5-10 13:23
（1）体系尺寸较小，直接用DLPNO近似，无需CIM近似。减小核数，增加每核内存。
（2）由于你做的是非限 ...

谢谢老师的解答我做的就是非限制性开壳层计算我去试试您说的方法

作者
Author: 菓瀛 时间: 2025-5-16 15:46

zjxitcc 发表于 2025-5-10 13:23
（1）体系尺寸较小，直接用DLPNO近似，无需CIM近似。减小核数，增加每核内存。
（2）由于你做的是非限 ...

老师我做的是非限制性开壳层计算使用cc-pvtz可以成功算出来 cc-pvqz算不出来 (原因是机子内存不足)
按您说的(3) 我可以使用cc-pvtz计算单点能去检验波函数的稳定性然后使用cc-pvqz基组读取UHF波函数进行单点能计算吗

作者
Author: zjxitcc 时间: 2025-5-16 18:28

菓瀛发表于 2025-5-16 15:46
老师我做的是非限制性开壳层计算使用cc-pvtz可以成功算出来 cc-pvqz算不出来 (原因是机子内存不足)
按 ...

可以的，cc-pVTZ基组下的稳定波函数，在经过cc-pVQZ读取后，极大概率仍然是稳定的，因此无需在cc-pVQZ下做波函数稳定性检验。

作者
Author: 菓瀛 时间: 2025-5-16 22:29
本帖最后由菓瀛于 2025-5-16 22:45 编辑

zjxitcc 发表于 2025-5-16 18:28
可以的，cc-pVTZ基组下的稳定波函数，在经过cc-pVQZ读取后，极大概率仍然是稳定的，因此无需在cc-pVQZ下 ...

好呢谢谢老师

我使用cc-pVTZ的波函数去计算cc-pVQZ下的单点能关键词这样写您看可以不
(, 下载次数 Times of downloads: 45)

还有请问一下用哪个关键词可以规避在cc-pVQZ下检验波函数的稳定性呢还是系统会默认不去检验呢 <跪谢大佬指点>

作者
Author: zjxitcc 时间: 2025-5-17 10:38
本帖最后由 zjxitcc 于 2025-5-17 10:41 编辑

菓瀛发表于 2025-5-16 22:29
好呢谢谢老师

我使用cc-pVTZ的波函数去计算cc-pVQZ下的单点能关键词这样写您看可以不

默认不检验。然而，你这么提问似乎在暗示你不知道如何在cc-pVTZ基组下检验波函数稳定性，建议阅读
http://bbs.keinsci.com/forum.php ... 02&fromuid=2632

作者
Author: 菓瀛 时间: 2025-5-17 10:49

zjxitcc 发表于 2025-5-17 10:38
默认不检验。然而，你这么提问似乎在暗示你不知道如何在cc-pVTZ基组下检验波函数稳定性，建议阅读
http ...

好的老师我明白啦感谢您的耐心解答

欢迎光临计算化学公社 (http://bbs.keinsci.com/)