计算化学公社

标题: Zen2下linux和win中ORCA的速度和并行效率测试 [打印本页]

作者
Author:
pika02    时间: 2020-3-11 15:05
标题: Zen2下linux和win中ORCA的速度和并行效率测试
硬件:CPU为3950X 16核(降压0.085V,PBO全自动),B450芯片组,双通道DDR4 3200 32GB*2。
系统和软件:Linux Mint Debian Edition 3 (LMDE3 Cindy),ORCA 4.2.1,OpenMPI 3.1.4;Windwos 10 Pro for Workstations,ORCA 4.2.1,Microsoft MPI 10.1.2。
测试文件:vomilenine的结构优化 (, 下载次数 Times of downloads: 38)


结果一表流:
                                               
cores
time
time / s
spd. vs. 1 core
eff. vs. 1 core
spd. vs. win
orca 4.2.1
openmpi 3.1.4

linux mint
debian edition 3
1
2h56min53.3s
10613.3
1.00
100.0%
114.01%
2
1h28min28.0s
5308.0
2.00
100.0%
120.74%
4
49min24.4s
2964.4
3.58
89.5%
114.67%
8
26min4.6s
1564.6
6.78
84.8%
116.79%
12
18min41.6s
1121.6
9.46
78.9%
123.52%
16
16min19.6s
979.6
10.83
67.7%
128.99%
cores
time
time / s
spd. vs. 1 core
eff. vs. 1 core
spd. vs. linux
orca 4.2.1
microsoft mpi 10.1.2

windows 10 pro
for workstation
1
3h21min39.9s
12099.9
1.00
100.0%
87.71%
2
1h46min48.8s
6408.8
1.89
94.4%
82.82%
4
56min39.3s
3399.3
3.56
89.0%
87.21%
8
30min27.3s
1827.3
6.62
82.8%
85.62%
12
23min5.4s
1385.4
8.73
72.8%
80.96%
16
21min3.6s
1263.6
9.58
59.8%
77.52%

二图流:
(, 下载次数 Times of downloads: 40)

(, 下载次数 Times of downloads: 49)

可以看出,linux下的ORCA始终强于windows下,但强得不算很过分。某软件win版比linux版慢一半多,用win版简直自取其辱
并行效率随核数增长而下降是非常明显的,如果要计算中小体系的一系列分子,最好是一个任务使用较少核心,然后多开任务。我同时开2个8核测试,分别花了28min13s和28min16s,略比单开8核任务慢,但肯定比用上16核一个接着一个跑明显要快。

日常使用windows的用户要用ORCA的话也没必要折腾虚拟机了。但是之前有群友优化一百多原子体系时,win版的orca报错,不知是不是msmpi的锅,这种情况最好还是用linux版本试一下。


作者
Author:
xp47    时间: 2020-3-11 15:18
优秀😂 师弟看起来可以在windows下做msdft了哈哈哈哈哈
作者
Author:
yygong    时间: 2020-3-11 15:25
本帖最后由 yygong 于 2020-3-11 15:28 编辑

请问能否分享下win版的ORCA 4.2.1,sob老师分享各个版本的逆戟鲸 中没有win 版本的ORCA 4.2.1,谢谢了
作者
Author:
pika02    时间: 2020-3-11 18:52
yygong 发表于 2020-3-11 15:25
请问能否分享下win版的ORCA 4.2.1,sob老师分享各个版本的逆戟鲸 中没有win 版本的ORCA 4.2.1,谢谢了

http://bbs.keinsci.com/forum.php ... 19&fromuid=4659
作者
Author:
天道啊啊    时间: 2020-3-11 18:59
问一下你的LINUX是虚拟机还是直接安的系统? 我用vmware workstation虚拟机上的ubuntu 19.04,和WIN10教育版 1809对比,采用3950X锁4.0G,差距没你这么大,是因为虚拟机的性能损失?
作者
Author:
yygong    时间: 2020-3-11 20:43
pika02 发表于 2020-3-11 18:52
http://bbs.keinsci.com/forum.php?mod=redirect&goto=findpost&ptid=6392&pid=109619&fromuid=4659

非常感谢!
作者
Author:
pika02    时间: 2020-3-12 00:09
天道啊啊 发表于 2020-3-11 18:59
问一下你的LINUX是虚拟机还是直接安的系统? 我用vmware workstation虚拟机上的ubuntu 19.04,和WIN10教育 ...

我直接装物理机上的
作者
Author:
sobereva    时间: 2020-3-12 11:43
yygong 发表于 2020-3-11 15:25
请问能否分享下win版的ORCA 4.2.1,sob老师分享各个版本的逆戟鲸 中没有win 版本的ORCA 4.2.1,谢谢了

4.2.1和4.2基本没差别
作者
Author:
monoyu    时间: 2020-3-22 21:01
你好,看你之前的发的机器配置,msi B450i 的内存是上了32GB×2是吧?看官网上关于主板的规格介绍总内存只支持到32GB?有点疑惑。
作者
Author:
pika02    时间: 2020-3-23 00:07
本帖最后由 pika02 于 2020-3-23 00:09 编辑
monoyu 发表于 2020-3-22 21:01
你好,看你之前的发的机器配置,msi B450i 的内存是上了32GB×2是吧?看官网上关于主板的规格介绍总内存只 ...

官网介绍的信息比较旧,卖内存的商人跟我说点不亮包退,我就放心大胆下单了两条32g
你也没必要照着我的配置抄,能上豪华供电的大板还是尽量上


作者
Author:
Picardo    时间: 2020-3-23 09:18
好贴,没用过orca,对速度没有直观的概念。请问这个体系要是到IU上同样的核大概是什么个时间
作者
Author:
monoyu    时间: 2020-3-23 11:44
pika02 发表于 2020-3-23 00:07
官网介绍的信息比较旧,卖内存的商人跟我说点不亮包退,我就放心大胆下单了两条32g
你也没必要照着我的 ...

感谢解疑。
作者
Author:
pika02    时间: 2020-3-23 14:42
本帖最后由 pika02 于 2020-3-23 14:48 编辑
Picardo 发表于 2020-3-23 09:18
好贴,没用过orca,对速度没有直观的概念。请问这个体系要是到IU上同样的核大概是什么个时间

不同时期的IU也没法比;之前找朋友试了一下2696V2,开12核跑同样任务花了这个时间的约两倍
作者
Author:
gozxc    时间: 2020-6-10 13:33
谢谢楼主,参考一下,win10,ORCA 4.2.1,2667V2,16核,花了36min21sec
作者
Author:
monoyu    时间: 2020-6-11 11:37
感谢楼主。
CPU: 3900X 12核(1.360V,锁全核4.2GHz),B450芯片组,双通道DDR4 2666 16GB*2。
ORCA 4.2.0,Windwos 10 Pro 1903,Microsoft MPI 10。
用时 22min22sec, 供大家参考。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3