计算化学公社

 找回密码 Forget password
 注册 Register
Views: 16719|回复 Reply: 20
打印 Print 上一主题 Last thread 下一主题 Next thread

[ORCA] ORCA5和ORCA4.21的耗时问题

[复制链接 Copy URL]

140

帖子

0

威望

1633

eV
积分
1773

Level 5 (御坂)

ORCA5出来之后,很多测评都说其计算耗时减少了,于是我用之前我ORCA4.2.1算完了的一个体系检测,4.21版本耗时1 hours 25 minutes。结果大跌眼镜,ORCA5居然用了3 hours 12 minutes

然后仔细检查了下步骤,4.2.1版本优化用了45轮,而5.0版本优化才用了35轮! 这更奇怪了,为啥用时还更多?

4.2.1版本每次SCF大概15步左右,耗时1min多;而5.0版本也差不多SCF10步左右,但是耗时3~5 min左右。这就让人非常不解了!
(4.2.1版本用的openmpi3.1.4;5.0版本用的openmpi4.1.1)

ORCA4.2.1版本计算的见附件解压后的“O421 VTA+CrO4.out”,ORCA5计算的见附件解压后的“O5 VTA+CrO4.out”

数据.rar

509.41 KB, 下载次数 Times of downloads: 31

3097

帖子

29

威望

1万

eV
积分
17221

Level 6 (一方通行)

2#
发表于 Post on 2021-8-2 23:55:59 | 只看该作者 Only view this author
格点数量不同?

1万

帖子

0

威望

9896

eV
积分
22146

Level 6 (一方通行)

3#
发表于 Post on 2021-8-3 00:36:12 | 只看该作者 Only view this author
一方面是因为格点增大了,另一方面可以把两个计算重新各跑一遍再看看,有的机器上计算时间重复性不好
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

140

帖子

0

威望

1633

eV
积分
1773

Level 5 (御坂)

4#
 楼主 Author| 发表于 Post on 2021-8-3 07:15:23 | 只看该作者 Only view this author

可能吧,4.2.1用的grid4 gridx4。5.0用得默认。但是差别这么大不应该啊

82

帖子

4

威望

2540

eV
积分
2702

Level 5 (御坂)

5#
发表于 Post on 2021-8-3 10:41:10 | 只看该作者 Only view this author
opt任务得看是否收敛到了相同的极小点了吧,不然比较耗时没有意义

82

帖子

4

威望

2540

eV
积分
2702

Level 5 (御坂)

6#
发表于 Post on 2021-8-3 10:45:45 | 只看该作者 Only view this author
winnerwill 发表于 2021-8-3 10:41
opt任务得看是否收敛到了相同的极小点了吧,不然比较耗时没有意义

目测,ORCA421收敛到了更低的能量(考虑到起始结构一样的话)
注意到两者最终结构都并不是优化过程中能量最低的

334

帖子

1

威望

6161

eV
积分
6515

Level 6 (一方通行)

7#
发表于 Post on 2021-8-3 11:37:44 | 只看该作者 Only view this author
我用你的输入文件分别在两个版本下都跑了一次。

VMware16+CentOS8
相同的设置下。(两个任务都用8核心 2000m内存)
用ORCA4.2.1的时候 跟你的计算结果几乎一模一样。比你之前上传的文件里4.2.1的输出文件显示的时间要略慢一些(93min vs 85min)。
但用ORCA5 的时候,虽然结果也是跟你算的一模一样,但就比你的orca5那个计算文件里显示的要快三倍速度。(54min vs 192min)


是不是你的硬件环境跟你当初跑4.2.1的时候发生了什么变化。

计算结果.zip

975.17 KB, 下载次数 Times of downloads: 27

140

帖子

0

威望

1633

eV
积分
1773

Level 5 (御坂)

8#
 楼主 Author| 发表于 Post on 2021-8-3 12:37:17 | 只看该作者 Only view this author
winnerwill 发表于 2021-8-3 10:45
目测,ORCA421收敛到了更低的能量(考虑到起始结构一样的话)
注意到两者最终结构都并不是优化过程中能 ...

对整个优化过程是这样,但是现在我疑惑的是每一轮优化的SCF时间为啥差别那么大。

140

帖子

0

威望

1633

eV
积分
1773

Level 5 (御坂)

9#
 楼主 Author| 发表于 Post on 2021-8-3 12:39:23 | 只看该作者 Only view this author
paramecium86 发表于 2021-8-3 11:37
我用你的输入文件分别在两个版本下都跑了一次。

VMware16+CentOS8

谢谢热心地验算,那你的8核心效率好高啊!!还是虚拟机,比我24核的都快! 锐龙还是最新酷睿?  

我前后硬件没变,都是24核心80G内存。ORCA5的SCF时间要那么多,我也很纠结。

140

帖子

0

威望

1633

eV
积分
1773

Level 5 (御坂)

10#
 楼主 Author| 发表于 Post on 2021-8-3 12:40:01 | 只看该作者 Only view this author
wzkchem5 发表于 2021-8-3 00:36
一方面是因为格点增大了,另一方面可以把两个计算重新各跑一遍再看看,有的机器上计算时间重复性不好

好的,待会我改变格点跑跑看。

334

帖子

1

威望

6161

eV
积分
6515

Level 6 (一方通行)

11#
发表于 Post on 2021-8-3 13:10:24 | 只看该作者 Only view this author
renzhogn424 发表于 2021-8-3 12:39
谢谢热心地验算,那你的8核心效率好高啊!!还是虚拟机,比我24核的都快! 锐龙还是最新酷睿?  

我前后 ...

是5900X。

在4.2.1下还是不如你的那个24核的。我觉得4.2.1那个结果可以体现cpu的算力差异。 但5.0.1下那个结果我觉得有些异常。5900x即使快也不可能快到24核的三四倍。

82

帖子

4

威望

2540

eV
积分
2702

Level 5 (御坂)

12#
发表于 Post on 2021-8-3 13:41:48 | 只看该作者 Only view this author
renzhogn424 发表于 2021-8-3 12:37
对整个优化过程是这样,但是现在我疑惑的是每一轮优化的SCF时间为啥差别那么大。

SCF的不同主要是因为一个大的不同是ORCA 4.2.1你用了以下关键词,而ORCA 5没有

%scf DirectResetFreq=1 end

82

帖子

4

威望

2540

eV
积分
2702

Level 5 (御坂)

13#
发表于 Post on 2021-8-3 13:45:50 | 只看该作者 Only view this author
paramecium86 发表于 2021-8-3 11:37
我用你的输入文件分别在两个版本下都跑了一次。

VMware16+CentOS8

并非真的一模一样,你的ORCA5的优化步数是比楼主的多了一步(37 vs 36);而两者ORCA 4.2.1的细微区别可能是数值误差方面的?

334

帖子

1

威望

6161

eV
积分
6515

Level 6 (一方通行)

14#
发表于 Post on 2021-8-3 14:19:03 | 只看该作者 Only view this author
本帖最后由 paramecium86 于 2021-8-3 14:32 编辑
winnerwill 发表于 2021-8-3 13:45
并非真的一模一样,你的ORCA5的优化步数是比楼主的多了一步(37 vs 36);而两者ORCA 4.2.1的细微区别可 ...

是的。我觉得有数值误差。不过最后能量的区别都已经是小数点后面那么多位了。
令人最疑惑的是orca5里楼主那个计算每一步的时间都比我这里慢上三倍。这个就不知道该用什么解释了。orca本身也不需要自己编译。速度上差那么多就很奇怪。
而优化的结构方面如果用我的ORCA5的结构作为基准几个优化结构的RMSD如下
                                   RMSD
ORCA5.0.1  5900x         0.0000
ORCA5.0.1  楼主           0.0017
ORCA4.2.1 5900x          0.0903
ORCA4.2.1 楼主            0.0906

同一个版本下至少收敛到的结构基本还是一样的。所以楼主的计算我觉得最让人迷惑的就是他的平台上ORCA5计算的速度了。

1万

帖子

0

威望

9896

eV
积分
22146

Level 6 (一方通行)

15#
发表于 Post on 2021-8-3 15:39:04 | 只看该作者 Only view this author
winnerwill 发表于 2021-8-3 03:45
目测,ORCA421收敛到了更低的能量(考虑到起始结构一样的话)
注意到两者最终结构都并不是优化过程中能 ...

这个能量没有可比性,因为ORCA 4的格点和ORCA 5的不一样,能量差别可能完全是因为格点
Zikuan Wang
山东大学光学高等研究中心 研究员
BDF(https://bdf-manual.readthedocs.io/zh_CN/latest/Introduction.html)、ORCA(https://orcaforum.kofo.mpg.de/index.php)开发团队成员
Google Scholar: https://scholar.google.com/citations?user=XW6C6eQAAAAJ
ORCID: https://orcid.org/0000-0002-4540-8734
主页:http://www.qitcs.qd.sdu.edu.cn/info/1133/1776.htm
GitHub:https://github.com/wzkchem5
本团队长期招收研究生,有意者可私信联系

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-27 06:16 , Processed in 0.261907 second(s), 28 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list