计算化学公社
标题: 发现一触发 Inaccurate quadrature in CalDSu 的原因 [打印本页]
作者Author: liyuanhe211 时间: 2015-11-27 04:47
标题: 发现一触发 Inaccurate quadrature in CalDSu 的原因
本帖最后由 liyuanhe211 于 2015-11-27 07:04 编辑
- Inaccurate quadrature in CalDSu.
复制代码
这是一个不太常见的l502错误,今天愚蠢的错误发现了一个触发它的新“方法”:两个独立同时运行的输入文件读取同一套chk和rwf文件。输入文件如下,部分信息被隐去。(该输入文件是一个小脚本批量生成的,所以有些写法有点怪异,比如 16000MB 而不是 16GB,请忽略)
- %nprocshared=4
- %mem=16000MB
- %rwf=/home/[something here]/Insertion_M0004.rwf
- %nosave
- %chk=/home/[something here]/Insertion_M0004_Step0.chk
- #p
- blyp/genecp
- opt
- freq
- empiricaldispersion=gd3bj
- 5d
- Insertion_Prod_sdf_M0004
- 0 1
- C 0 2.2643 0.8258 0.1275
- [COORDINATES...]
- [6-31G(d) / LanL2DZ Basis Statement]
复制代码
而另一个输入文件是偷懒复制这个文件生成的,一个构象搜索得到的次要构象,故只替换了坐标,于是link0命令被原样保留:
- %rwf=/home/[something here]/Insertion_M0004.rwf
- %nosave
- %chk=/home/[something here]/Insertion_M0004_Step0.chk
复制代码
输入1于 [2015.11.25 16:18:07] 启动,[任务时 6:12:56] 进入第 43 个 opt cyclo 的 SCF 过程,前序 SCF (l502) 平均时间为 6.13 分钟。
输入2于 [2015.11.25 22:34:07],输入1的 [任务时 6:16:00] 启动,于29秒后终止。
输入1于 [2015.11.25 22:35:45 / 任务时 6:17:38] 在第 43 个 opt cyclo 的第 10 个 SCF 迭代报 "Inaccurate quadrature in CalDSu.",1s 后终止。
此类错误指征:
最后5个循环的输出如下(部分信息因冗长被被删去):
- Cycle 6 Pass 1 IDiag 1:
- RMSU= 8.45D-07 CP: 1.00D+00 9.80D-01 1.61D-01 2.66D-01 1.02D-01
- <font color="#ff0000">E= -2792.83730331193</font> Delta-E= -0.000002445015 Rises=F Damp=F
- DIIS: error= 2.47D-05 at cycle 6 NSaved= 6.
- NSaved= 6 IEnMin= 6 EnMin= -2792.83730331193 IErMin= 2 ErrMin= 2.31D-05
- Gap= 0.040 Goal= None Shift= 0.000
- RMSDP=6.63D-07 MaxDP=9.72D-05 DE=-2.45D-06 OVMax= 1.21D-04
- Cycle 7 Pass 1 IDiag 1:
- RMSU= 1.85D-07 CP: 1.00D+00 9.81D-01 1.72D-01 3.94D-01 1.61D-01
- CP: 3.45D-01
- <font color="#ff0000">E= -2792.83730360663</font> Delta-E= -0.000000294709 Rises=F Damp=F
- DIIS: error= 1.73D-06 at cycle 7 NSaved= 7.
- NSaved= 7 IEnMin= 7 EnMin= -2792.83730360663 IErMin= 7 ErrMin= 1.73D-06
- Gap= 0.040 Goal= None Shift= 0.000
- RMSDP=1.26D-07 MaxDP=1.19D-05 DE=-2.95D-07 OVMax= 1.70D-05
- Cycle 8 Pass 1 IDiag 1:
- RMSU= 6.67D-08 CP: 1.00D+00 9.82D-01 1.77D-01 4.00D-01 1.75D-01
- CP: 3.44D-01 4.55D-01
- <font color="#ff0000">E= -2239.03282931009</font> Delta-E= 553.804474296549 Rises=F Damp=F
- DIIS: error= 1.01D+02 at cycle 8 NSaved= 8.
- NSaved= 8 IEnMin= 7 EnMin= -2792.83730360663 IErMin= 7 ErrMin= 1.73D-06
- Gap= -0.300 Goal= None Shift= 0.000
- RMSDP=2.21D+00 MaxDP=3.86D+02 DE= 5.54D+02 OVMax= 8.55D-01
- Cycle 9 Pass 1 IDiag 1:
- RMSU= 2.21D+00 CP: 3.00D+00 3.00D+00 -3.00D+00 -3.00D+00 -3.00D+00
- CP: -3.00D+00 -3.00D+00 3.00D+00
- <font color="#ff0000">E= -73546.3417349360</font> Delta-E= -71307.308905625860 Rises=F Damp=F
- DIIS: error= 7.51D+10 at cycle 9 NSaved= 9.
- NSaved= 9 IEnMin= 9 EnMin= -73546.3417349360 IErMin= 7 ErrMin= 1.73D-06
- Gap= -1.050 Goal= None Shift= 0.000
- RMSDP=4.86D+08 MaxDP=3.63D+11 DE=-7.13D+04 OVMax= 6.49D-01
- Cycle 10 Pass 1 IDiag 1:
- RMSU= 4.86D+08 CP: 3.00D+00 -3.00D+00 3.00D+00 3.00D+00 -3.00D+00
- CP: 3.00D+00 -3.00D+00 -3.00D+00 -3.00D+00
- Spurious integrated density or basis function:
- NE= 372 NElCor= 0 El error=7.26D+11 rel=1.85D+09 Tolerance=1.00D-03
- Shell 216 absolute error=1.70D-04 Tolerance=1.20D-02
- Shell 51 signed error=1.20D-04 Tolerance=1.00D-01
- <font color="#ff0000">Inaccurate quadrature in CalDSu.</font>
- <font color="#ff0000">Error termination</font> via Lnk1e in /home/gauuser/g09/<font color="#ff0000">l502.exe</font> at Wed Nov 25 22:35:45 2015.
- Job cpu time: 1 days 1 hours 6 minutes 41.1 seconds.
- File lengths (MBytes): RWF= 333 Int= 0 D2E= 0 Chk= 40 Scr= 1
复制代码
可见在第6~7次迭代时已相对收敛,Cycle 8 突然出现了 553 个 Hartree的波动,Cyclo 9 直接爆到 -73 kHartree,Cyclo 10 就炸掉了。
综合考虑上面叙述的任务时间,以及如此不寻常的SCF曲线:
正常得 抽风的
(, 下载次数 Times of downloads: 22)
(, 下载次数 Times of downloads: 23)
(SCF的纵坐标单位是Hartree,第九个点下降太多被自动截掉了)
后来意识到两个文件输入了一样的 chk 和 rwf,所以一字未改从头重新运行了输入1:
(, 下载次数 Times of downloads: 18)
可以看到除了数值误差之外,明显的影响大致确实是从输入2启动的一刻开始的。
加之重新运行的输入1于其任务时 7:17:28 顺利完成opt,说明触发“Inaccurate quadrature in CalDSu.”的确实是输入关键词之外的因素导致的。
出错的 顺利结束的
(, 下载次数 Times of downloads: 36)
(, 下载次数 Times of downloads: 19)
下方为4个收敛限的收敛情况监测,坐标值为其当前值与收敛限的比值,上方为最后一次SCF收敛情况。
左右两图的前42次循环(下面的图)是相同的。
建议:
- 若在同时运行多个任务时,出现 “Inaccurate quadrature in CalDSu.” 时应当查看最后几步SCF收敛情况,看是否有上述指征,若有,应当查看是否有访问了共同 chk 和 rwf 的问题。若和别人共用机器,且各用户的权限管理不当时,应当注意不要取太简单的文件名。(还在用小PC跑的时候,曾经给别人分享了一个输入文件,类似于 prod.gjf,结果被人拿去用,直接放了它自己的坐标跑,把我原来的chk和rwf都覆盖了)。
- 另外有时一些其他的奇怪问题比如 L401错误也有可能是它造成的,不过就比较显然了:
- Bad dimensions in UnPckI.
- Error termination via Lnk1e in /home/gauuser/g09/l401.exe at Wed Nov 25 23:06:52 2015.
复制代码- 以及一些类似但一看就不对劲的常规SCF收敛报错(同样是-76kHartree的能量):
- (Enter /home/gauuser/g09/l502.exe)
- Line 50126: E= -2220.06144121282 Delta-E= -8.080445508238 Rises=F Damp=F
- Line 50139: E= -76430.9177902161 Delta-E= -74210.856349003250 Rises=F Damp=F
- Line 50151: E= -76381.6615428458 Delta-E= 49.256247370315 Rises=F Damp=F
- Line 50163: E= -76470.0630378597 Delta-E= -88.401495013954 Rises=F Damp=F
- Line 50175: E= -76439.0822894100 Delta-E= 30.980748449729 Rises=F Damp=F
- Line 50188: E= -76466.4716861857 Delta-E= -27.389396775674 Rises=F Damp=F
- >>>>>>>>>> Convergence criterion not met.
- SCF Done: E(RB-LYP) = -76472.4416419 A.U. after 129 cycles
- Convergence failure -- run terminated.
- Error termination via Lnk1e in /home/gauuser/g09/l502.exe at Wed Nov 25 23:34:15 2015.
复制代码 同时提示非特殊情况不要写scf=(maxcyclo=好几百),opt也是一回事。有闲心的话写个脚本监控输出文件,发现震荡给你发邮件也还是很爽心的。
(以及不要问我为什么一下有这么多文件访问同一套chk,rwf造成的错误)(要哭了,逃
- 最好写脚本运行输入,脚本里为每个输入文件建立自己的临时目录,输入在临时目录下运行,任务结束后再拷贝输出文件到用户目录,发现异常报错。(具体脚本可以参考ORCA说明书,有例子)
- 监控自己的任务(包括opt,scf 收敛情况),最好搞个实时更新的图形化的工具(拿GV看这个用起来太蠢了)。
- 出现错误之后不要直接去搜报错信息,首先观察一下出现问题之前发生了什么;更不要直接往群里、本论坛里一贴就完事了,问l9999错误,前面写着负的eigenvalue数目不对都不看,至少咨询别人的时候从末尾往前多提供一些信息,最好直接share输入输出,不要让别人悬丝诊脉。
另附Sob老师对 “Inaccurate quadrature in CalDSu.” 的解决方法:
(, 下载次数 Times of downloads: 33)
作者Author: 978142355 时间: 2015-11-27 08:22
Li老师您的开贴显示是新手求助,您还新手啊。。。。。。。。
作者Author: liyuanhe211 时间: 2015-11-27 09:40
本帖最后由 liyuanhe211 于 2015-11-27 09:42 编辑
蛤?点错了
不过只是这个话题不是新手求助而已,和人无关。
作者Author: 978142355 时间: 2015-11-27 12:19
我说嘛,一看见标题以为是哪个新手求助这个问题,毕竟sob在群里说了n次如何解决,一进来看见是Li老师的帖子,然后测试这个,感觉应该是Li老师弄错了。
不过也真万万没有想到,n个输入文件的%chk命名为1个竟会出现此错误。但是好像并不是100%遇到,最近有学生输入文件马虎(复制粘贴其它输入文件),%chk文件名称一样,但并未出现此问题。
作者Author: liyuanhe211 时间: 2015-11-27 14:50
就是需要第二个文件恰好在第一个文件的某个阶段启动
作者Author: 978142355 时间: 2015-11-27 15:04
哦,这个以前我还真没注意过,真没想到这个也会引起所说的错误。
作者Author: liyuanhe211 时间: 2015-11-27 16:57
Gaussian要从rwf和chk里读数据,结果被别的进程写了,谁也不会知道写进去了什么,读进来乱七八糟感觉是一切皆有可能
作者Author: 978142355 时间: 2015-11-27 19:33
恩,是啊,所以根据Li老师的结果,以后做的时候我可一定得校正对了,否则费力不讨好,浪费时间。
欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |