计算化学公社
标题:
ORCA跨节点并行效率测试
[打印本页]
作者Author:
liyuanhe211
时间:
2018-4-3 00:46
标题:
ORCA跨节点并行效率测试
本帖最后由 liyuanhe211 于 2018-4-3 00:49 编辑
最近需要做些大玩意儿,遂测试了一下ORCA的跨节点并行效率。
以单机、32核并行为基准,分别测试了DLPNO-CCSD(T)、RI-双杂化、和RI-BLYP的运行总时间。可见:
DLPNO-CCSD(T)
:DLPNO-CCSD(T) 在两节点时效率还好,可以利用;三节点时令人犹豫,不差钱可以用;四节点及以上不建议考虑。六节点开始所需 wall-time 超过单节点时间。
双杂化
:双杂化是并行效率最高的,在
三个节点
、96核并行的条件下都有有价值的并行效率。并且跨节点并行效率与单机并行差不很多。
六个节点
及以上测试案例的 wall-time 已超过了单节点时间,并不是节点数越多越好。
普通纯泛函
:在100个原子级别的分子上使用 RI-BLYP 时,并行对计算所需时间的降低很快收敛,两节点并行勉强可用,两节点以上的并行没有意义。
(, 下载次数 Times of downloads: 75)
上传 Uploaded
点击下载Click to download
注:
测试用 ORCA 4.0.1.2 版本进行,OpenMPI 2.0.2 并行,硬件环境为北京大学未名一号超算,其声称的数据互联环境是双口 1G Omni-Path 架构的网络、共享硬盘存储。
测试所用的分子大小已写在表中。这测试还是蛮烧钱的,没用更大的分子测试。更大的、所需时间更长的分子经验上会有更高的并行效率和有效并行核数的上限。
所用分子均为“正常的”有机分子,BLYP测试案例为Sob文章
http://sobereva.com/214
中 4.5 节的测试案例。因课题原因其他两个测试不能给出结构。PWPB95测试案例中为该分子的T1态,其余为S0。经验上开闭壳层不显著影响并行效率。
四路胖节点实际上有72个核,但只分别使用了32个和64个核,在监视过程中未观察到有抢占剩余核的其他任务,但不保证一直如此。实际上DLPNO的胖节点数据有点异常
因一般不用ORCA算梯度、频率,故只测了单点。
(但看到现在的结果,在买不起Lind
a的情况下,似乎ORCaussian还是有些用处的)
作者Author:
一派胡言
时间:
2018-10-28 11:13
为什么不用orca算梯度和频率呢?
作者Author:
liyuanhe211
时间:
2018-10-28 17:53
一派胡言 发表于 2018-10-28 11:13
为什么不用orca算梯度和频率呢?
ORCA的几何优化做的差。
作者Author:
hzfish
时间:
2018-10-31 09:15
liyuanhe211 发表于 2018-10-28 17:53
ORCA的几何优化做的差。
社长提出了Gaussian和ORCA 联用的方法进行几何优化和频率分析,李老师有没有兴趣测试一下。
特别是考虑溶剂效应的情况。
谢谢!
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3