计算化学公社

 找回密码 Forget password
 注册 Register
Views: 7085|回复 Reply: 20
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] 计算ECD时出现ORCA finished by error termination in CIS问题

[复制链接 Copy URL]

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

本帖最后由 ljc050512 于 2021-11-24 18:29 编辑

我是想尝试重复一篇文献计算ECD的,文章(Inorg. Chem. 2019, 58, 3670-3675)计算见下,原文献是用高斯算的。我把cif中的一个团簇挖出来,用H饱和后是这样的分子式:Au13 P10 C140 H140 O10 Cl2,共315个原子。
我参考了sob老师的文章,输入文件部分如下(没贴坐标):
! PBE0 def2-SV(P) def2/J RIJCOSX tightSCF noautostart miniprint nopop
%maxcore  16000
%pal nprocs   16 end
%cpcm
smd true
SMDsolvent "DICHLOROMETHANE"
end
%tddft
nroots 100
TDA false
end
我借的机器是44核2696V4,内存共256G。
运行中报错,输出文件的最后如下:
****Iteration    0****
   Memory handling for direct AO based RPA:
   Memory per vector needed      ...   507 MB
   Memory needed                 ... 152364 MB
   Memory available              ... 16000 MB
   Number of vectors per batch   ...    31
   Number of batches             ...    10
   Time for densities:           36.636
   Time for XC-Integration:     111.340
ORCA finished by error termination in CIS
Calling Command: mpirun -np 16  /home/o/orca_cis_mpi /home/ofs/1124/unit315-2.cisinp.tmp /home/ofs/1124/unit315-2
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run
我在论坛里看了一些贴子,大部分这样的情况是由于内存不够。
我想问一下,我是不是应该改为用8个核甚至4个核,然后加倍内存设置?
另:算这个体系可否用sob老师文章里提到的这个呢(见下)?还是应该继续用PBE0 def2-SV(P) def2/J RIJCOSX tightSCF noautostart miniprint nopop?
wB97X-D3 def2-SV(P) def2/J RIJCOSX
%tddft
Mode sTDDFT

计算.jpg (103.59 KB, 下载次数 Times of downloads: 25)

原文的计算说明

原文的计算说明

unit315-2.mol

26.35 KB, 下载次数 Times of downloads: 4

结构文件

1万

帖子

0

威望

9900

eV
积分
22154

Level 6 (一方通行)

2#
发表于 Post on 2021-11-24 18:38:43 | 只看该作者 Only view this author
maxcore乘以nprocs不能恰好等于总内存,要比总内存小至少20%左右。否则orca以为内存够用,结果内存不够用,就会报错。
如果还是内存不足,就改用sTDDFT
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

3#
 楼主 Author| 发表于 Post on 2021-11-25 05:33:27 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-24 18:38
maxcore乘以nprocs不能恰好等于总内存,要比总内存小至少20%左右。否则orca以为内存够用,结果内存不够用, ...

谢谢老师解答!我再去试试看。

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

4#
 楼主 Author| 发表于 Post on 2021-11-25 17:21:29 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-24 18:38
maxcore乘以nprocs不能恰好等于总内存,要比总内存小至少20%左右。否则orca以为内存够用,结果内存不够用, ...

****Iteration    0****

   Memory handling for direct AO based RPA:
   Memory per vector needed      ...   507 MB
   Memory needed                 ... 152364 MB
   Memory available              ... 20000 MB
   Number of vectors per batch   ...    39
   Number of batches             ...     8
   Time for densities:           41.188
   Time for XC-Integration:     189.591

ORCA finished by error termination in CIS
老师,我用了10核,每个核是20G,还剩余56G内存,但还是出现这个报错。我看out文件末尾显示:
Memory needed                 ... 152364 MB
   Memory available              ... 20000 MB
是不是这里的显示并不能反映真实的内存使用,而出现实际上内存不够,才报错的。

1万

帖子

0

威望

9900

eV
积分
22154

Level 6 (一方通行)

5#
发表于 Post on 2021-11-25 17:57:26 | 只看该作者 Only view this author
ljc050512 发表于 2021-11-25 10:21
****Iteration    0****

   Memory handling for direct AO based RPA:

TDDFT需要的内存是有一个下限的,如果你指定的内存小于这个下限,这个计算无论如何也不可能完成,所以就报错了。
设定的内存必须大于程序实际需要用的内存,但是小于总物理内存。我上一个帖子只是想排除后者的情况,但是现在看来主要影响因素在于前者,也就是程序实际需要用的内存太大了。这种情况下可以考虑降低核数,如果还不行就用sTDDFT
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

6#
 楼主 Author| 发表于 Post on 2021-11-26 12:34:34 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-25 17:57
TDDFT需要的内存是有一个下限的,如果你指定的内存小于这个下限,这个计算无论如何也不可能完成,所以就 ...

谢谢老师的指点。我用了sob老师的Multiwfn生成计算设置(带Mode sTDDFT)如下,还是用的10核,每核20G,总内存剩余56G:
|  1> ! wB97X-D3 def2-SV(P) def2/J RIJCOSX noautostart miniprint nopop
|  2> %maxcore  20000
|  3> %pal nprocs   10 end
|  4> %cpcm
|  5> smd true
|  6> SMDsolvent "DICHLOROMETHANE"
|  7> end
|  8> %tddft
|  9> Mode sTDDFT
| 10> Ethresh 7.0
| 11> PThresh 1e-4
| 12> PTLimit 30
| 13> triplets false
| 14> end

报错信息如下:
** On entry to SSYEVD parameter number  8 had an illegal value
[file orca_cis/cis_stda.cpp, line 1978, Process 9]:
Error (STDDFT) SMATPOW (LAPACKER) failed!


ORCA finished by error termination in CIS
Calling Command: mpirun -np 10  /home/o/orca_cis_mpi /home/ofs/1125/unit315-4.cisinp.tmp /home/ofs/1125/unit315-4
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run
我的问题有两个:
(1)报错的原因还是20G/核不够用对吧?
(2)基于之前报错的计算文件,我能否通过读取已经算好的一些部分来减少下一次的计算时间吗(因为Total SCF time: 0 days 16 hours 35 min 8 sec 有些长......)?比如读取上一次报错计算中算好的.gbw文件或者其他文件。我看到输出文件中,在SCF收敛之后有以下三句话,我猜测是不是能读取某些文件,直接进行后续计算呢?
**** THE GBW FILE WAS UPDATED (/home/ofs/1125/unit315-4.gbw) ****
**** DENSITY /home/ofs/1125/unit315-4.scfp WAS UPDATED ****
**** ENERGY FILE WAS UPDATED (/home/ofs/1125/unit315-4.en.tmp) ****
还是说,一定要重新开始计算?

1万

帖子

0

威望

9900

eV
积分
22154

Level 6 (一方通行)

7#
发表于 Post on 2021-11-26 15:29:14 | 只看该作者 Only view this author
ljc050512 发表于 2021-11-26 05:34
谢谢老师的指点。我用了sob老师的Multiwfn生成计算设置(带Mode sTDDFT)如下,还是用的10核,每核20G, ...

你用的是不是ORCA 5.0.0?这个是5.0.0的bug,在5.0.1应该已经修复了,参见https://orcaforum.kofo.mpg.de/vi ... ry+to+SSYEVD#p32557
sTDDFT计算可以读取之前TDDFT计算的SCF波函数。准确来说可以读取任何在同等级别下做的单点计算的SCF波函数
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

8#
 楼主 Author| 发表于 Post on 2021-11-26 16:21:07 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-26 15:29
你用的是不是ORCA 5.0.0?这个是5.0.0的bug,在5.0.1应该已经修复了,参见https://orcaforum.kofo.mpg.de ...

我是个很新的新手,接触ORCA的时候就已经是5.0.1版本了,所以我装的win版和Linux版都是5.0.1。那我去试试读取已经算好的波函数,然后降低核数到5,内存给到40G/核试试看。再次感谢老师的耐心解答!

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

9#
 楼主 Author| 发表于 Post on 2021-11-26 20:00:35 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-26 15:29
你用的是不是ORCA 5.0.0?这个是5.0.0的bug,在5.0.1应该已经修复了,参见https://orcaforum.kofo.mpg.de ...

老师好,我把核数降为5,每个核改为40G,读取上一次算好的.gbw
1> ! wB97X-D3 def2-SV(P) def2/J RIJCOSX noautostart miniprint nopop moread
|  2> %moinp "/home/ofs/1125/unit315-4.gbw"
|  3> %maxcore  40000
|  4> %pal nprocs   5 end
|  5> %cpcm
|  6> smd true
|  7> SMDsolvent "DICHLOROMETHANE"
|  8> end
|  9> %tddft
| 10> Mode sTDDFT
| 11> Ethresh 7.0
| 12> PThresh 1e-4
| 13> PTLimit 30
| 14> triplets false
| 15> end
我用的版本是5.0.1,输出文件前部有显示:
Program Version 5.0.1 -  RELEASE  -

报错信息和之前的一样:
** On entry to SSYEVD parameter number  8 had an illegal value
[file orca_cis/cis_stda.cpp, line 1978, Process 3]:
Error (STDDFT) SMATPOW (LAPACKER) failed!
您发我的orca论坛的链接我去看了,没看到在5.0.1修复某系bug的文字。
所以是不是5.0.1里还可能存在这个bug?
我这打算去掉sTDDFT再试试看。

1万

帖子

0

威望

9900

eV
积分
22154

Level 6 (一方通行)

10#
发表于 Post on 2021-11-26 20:29:56 | 只看该作者 Only view this author
ljc050512 发表于 2021-11-26 13:00
老师好,我把核数降为5,每个核改为40G,读取上一次算好的.gbw
1> ! wB97X-D3 def2-SV(P) def2/J RIJCOS ...

那可能还没修复,你在那个orca论坛的帖子底下回个帖吧,就说发现这个bug还没有修复。ORCA 5.0.2马上就要出了,怕负责这一块代码的人忘了
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

11#
 楼主 Author| 发表于 Post on 2021-11-26 20:39:47 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-26 20:29
那可能还没修复,你在那个orca论坛的帖子底下回个帖吧,就说发现这个bug还没有修复。ORCA 5.0.2马上就要 ...

好的老师,我去论坛加一句。我今晚去掉sTDDFT试试看。

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

12#
 楼主 Author| 发表于 Post on 2021-11-27 06:42:27 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-26 20:29
那可能还没修复,你在那个orca论坛的帖子底下回个帖吧,就说发现这个bug还没有修复。ORCA 5.0.2马上就要 ...

老师好。我改回不带STDDFT的计算设置,读取了之前算过的.gbw文件,用了5个核,每核40G
1> ! PBE0 def2-SV(P) def2/J RIJCOSX tightSCF noautostart miniprint nopop moread
|  2> %moinp "/home/ofs/1126/unit315-2.gbw"
|  3> %maxcore  40000
|  4> %pal nprocs   5 end
|  5> %cpcm
|  6> smd true
|  7> SMDsolvent "DICHLOROMETHANE"
|  8> end
|  9> %tddft
| 10> nroots 100
| 11> TDA false
| 12> end
算了一夜之后,目前没有报错。但是我看out文件里有如下内容:

*** TD-DFT CALCULATION INITIALIZED ***

---------------------------------
    LR-CPCM (non-equilibrium)
---------------------------------

Setting up LR-CPCM             ... done

-------------------
RPA-DIAGONALIZATION
-------------------

Dimension of the (A+B)(A-B) eigenvalue problem ... 2329960
Number of roots to be determined               ...    100
Maximum size of the expansion space            ...   3000
Convergence tolerance for the residual         ...    2.500e-07
Convergence tolerance for the energies         ...    2.500e-07
Orthogonality tolerance                        ...    1.000e-14
Constructing the preconditioner                ... o.k.
Building the initial guess                     ... o.k.
Number of trial vectors determined             ...   3000


                       ****Iteration    0****

   Memory handling for direct AO based RPA:
   Memory per vector needed      ...   507 MB
   Memory needed                 ... 152364 MB
   Memory available              ... 40000 MB

   Number of vectors per batch   ...    78
   Number of batches             ...     4
   Time for densities:           76.981
   Time for XC-Integration:     708.012
   Time for K (COSX):          5206.741
   Time for RI-J (Direct):     6076.274
   Time for LR-CPCM terms:     1058.518
   Time for Sigma-Completion:   166.229
   Time for densities:           76.988
   Time for XC-Integration:     704.786
   Time for K (COSX):          5620.540
   Time for RI-J (Direct):     6754.526
   Time for LR-CPCM terms:     1054.274
   Time for Sigma-Completion:   164.043
   Time for densities:           73.057
这里需要的内存152364 MB,是指的每个核需要150G多的内存对吗?而我给的只有40G/核。能否理解为只是暂时没报错?
另:我再orca论坛里那个帖子下面给出了相关bug的信息,并提问能否会在5.0.2修复。尽早消息提示:
Report closed by FrankNeese for: "Re: Error (STDDFT) SMATPOW (LAPACKER) failed!"

Fri Nov 26, 2021 8:59 pm
是不是意味着我的回复被删除了?没怎么用过那个论坛,里面的规则不太懂。

1万

帖子

0

威望

9900

eV
积分
22154

Level 6 (一方通行)

13#
发表于 Post on 2021-11-27 16:02:00 | 只看该作者 Only view this author
ljc050512 发表于 2021-11-26 23:42
老师好。我改回不带STDDFT的计算设置,读取了之前算过的.gbw文件,用了5个核,每核40G
1> ! PBE0 def2-S ...

这里的Memory needed其实并不是最小需要的内存,而是最小的不影响计算速度的内存。如果实际内存比这个数小,但是小得不多,那么可以通过重复计算某些量来减少内存占用,所以计算仍然可以进行,只是变慢了。
发帖的问题我也不清楚怎么回事,没遇到过这个情况
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

114

帖子

0

威望

1038

eV
积分
1152

Level 4 (黑子)

14#
 楼主 Author| 发表于 Post on 2021-11-27 16:15:05 | 只看该作者 Only view this author
wzkchem5 发表于 2021-11-27 16:02
这里的Memory needed其实并不是最小需要的内存,而是最小的不影响计算速度的内存。如果实际内存比这个数 ...

好的老师。我这次的计算出现两个“Iteration”后报错。奇怪的是在Iteration    0的时候能算完;而在出现Iteration    1的时候报错,错误的信息和之前一样。
                      ****Iteration    0****

   Memory handling for direct AO based RPA:
   Memory per vector needed      ...   507 MB
   Memory needed                 ... 152364 MB
   Memory available              ... 40000 MB
   Number of vectors per batch   ...    78
   Number of batches             ...     4
   Time for densities:           76.981
   Time for XC-Integration:     708.012
   Time for K (COSX):          5206.741
   Time for RI-J (Direct):     6076.274
   Time for LR-CPCM terms:     1058.518
   Time for Sigma-Completion:   166.229
   Time for densities:           76.988
   Time for XC-Integration:     704.786
   Time for K (COSX):          5620.540
   Time for RI-J (Direct):     6754.526
   Time for LR-CPCM terms:     1054.274
   Time for Sigma-Completion:   164.043
   Time for densities:           73.057
   Time for XC-Integration:     695.826
   Time for K (COSX):          5643.918
   Time for RI-J (Direct):     6843.105
   Time for LR-CPCM terms:     1061.135
   Time for Sigma-Completion:   163.113
   Time for densities:           62.223
   Time for XC-Integration:     594.980
   Time for K (COSX):          4837.088
   Time for RI-J (Direct):     4533.619
   Time for LR-CPCM terms:      915.686
   Time for Sigma-Completion:   136.551
   Size of expansion space: 300
   Lowest Energy          :     0.004032913467
   Maximum Energy change  :     0.066557769674 (vector 99)
   Maximum residual norm  :     0.004440731712

                      ****Iteration    1****
   Time for densities:           82.405
   Time for XC-Integration:     793.292

ORCA finished by error termination in CIS
Calling Command: mpirun -np 5  /home/o/orca_cis_mpi /home/ofs/1126/unit315-2-2.cisinp.tmp /home/ofs/1126/unit315-2-2
[file orca_tools/qcmsg.cpp, line 458]:
  .... aborting the run

我是不是应该再减少核数,再加内存。

1万

帖子

0

威望

9900

eV
积分
22154

Level 6 (一方通行)

15#
发表于 Post on 2021-11-27 16:32:52 | 只看该作者 Only view this author
ljc050512 发表于 2021-11-27 09:15
好的老师。我这次的计算出现两个“Iteration”后报错。奇怪的是在Iteration    0的时候能算完;而在出现I ...

对,可以试一下。因为第0步迭代用的内存不会完全释放,有一部分内存是即使第0步迭代结束了也还在继续占用的(用来存放第0步产生的矢量),所以第1步迭代时程序消耗的总内存比第0步多
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-27 13:09 , Processed in 0.232989 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list