请选择 进入手机版 | 继续访问电脑版

计算化学公社

 找回密码
 现在注册!
查看: 1048|回复: 14

[配置讨论] 四路的服务器跑vasp效率怎么样

[复制链接]

50

帖子

0

威望

704

eV
积分
754

Level 4 (黑子)

发表于 2019-12-26 20:45:46 | 显示全部楼层 |阅读模式
本帖最后由 灰天皮匠 于 2019-12-26 21:09 编辑

前段时间课题组买了一台四路的服务器用来跑vasp,配置如下:
CPU Intel Xeon 6148 *4
内存 三星DDR4 RECC 2666MHz 8g*24

一开始还没发觉什么问题,后来用服务器的同学说不如双路的旧服务器快,算的体系大概100个原子左右。于是将8g内存条换成16g的,发现单个任务的提升也就是11~13%。两个算例一起提交用的核数多的任务反而会被拉低,和核数少的算例一起结束。

不知道各位老师同学有没有过组四路跑vasp的经验可以分享一下,是配置不合理还是软件不适合四路,也有可能是我的测试方法有问题

最主要的还是看看有没有提升效率的方法,不太想浪费那么多核数,最后跑出来和双路一样的效果。

240

帖子

0

威望

775

eV
积分
1015

Level 4 (黑子)

发表于 2019-12-27 10:01:57 | 显示全部楼层
双路四路运行环境一样吗,不过四路效率本来就是不行

50

帖子

0

威望

704

eV
积分
754

Level 4 (黑子)

 楼主| 发表于 2019-12-27 10:09:46 | 显示全部楼层
biogon 发表于 2019-12-27 10:01
双路四路运行环境一样吗,不过四路效率本来就是不行

都是用intel2015编译的,系统倒是有CentOS7.x版本上的差别。如果多数情况下四路效率一般,那么哪种情况是会优于双路的计算效果呢?就是说,想充分发挥它的性能的话,您有没有一些比较好的建议

69

帖子

0

威望

1363

eV
积分
1432

Level 4 (黑子)

发表于 2019-12-27 14:19:33 | 显示全部楼层
考虑一下vasp的并行效率,你在4路的服务器上测试一下用1路、2路、3路、4路跑同一个作业测试一下,看看哪个加速比最好,也许你4路的还没3路甚至两路的快。

50

帖子

0

威望

704

eV
积分
754

Level 4 (黑子)

 楼主| 发表于 2019-12-27 14:58:11 | 显示全部楼层
pwzhou 发表于 2019-12-27 14:19
考虑一下vasp的并行效率,你在4路的服务器上测试一下用1路、2路、3路、4路跑同一个作业测试一下,看看哪个 ...

测试结果如图,4路确实不如2路。请问有没有什么办法可以充分利用一下它的算力?
测试结果.png

69

帖子

0

威望

1363

eV
积分
1432

Level 4 (黑子)

发表于 2019-12-27 15:07:06 | 显示全部楼层
灰天皮匠 发表于 2019-12-27 14:58
测试结果如图,4路确实不如2路。请问有没有什么办法可以充分利用一下它的算力?

这种情况同时跑两个双路的作业应该是比较好的选择,当作业很大,两路算不动的时候,再用4路去跑。

50

帖子

0

威望

704

eV
积分
754

Level 4 (黑子)

 楼主| 发表于 2019-12-27 15:18:25 | 显示全部楼层
pwzhou 发表于 2019-12-27 15:07
这种情况同时跑两个双路的作业应该是比较好的选择,当作业很大,两路算不动的时候,再用4路去跑。

只看图中的测试结果的话,同时跑两个双路有时甚至不如一个任务一个任务地算
不过这也是没办法中的办法感谢

69

帖子

0

威望

1363

eV
积分
1432

Level 4 (黑子)

发表于 2019-12-27 15:22:20 | 显示全部楼层
灰天皮匠 发表于 2019-12-27 15:18
只看图中的测试结果的话,同时跑两个双路有时甚至不如一个任务一个任务地算
不过这也是没办法中的办 ...

实际上就是这样,每个软件的并行效率都是有限的,所以很多时候不是核数越多越快,有的软件并行效率很差的时候,比如用molpro算CASSCF如果体系很大,活化空间比较大,用单核算是最快的。软件的并行效率我们一般是没啥办法的,所以就去测试一下,看看核数多少加速比最好,那么就选择这个即可。

240

帖子

0

威望

775

eV
积分
1015

Level 4 (黑子)

发表于 2019-12-27 17:41:41 | 显示全部楼层
灰天皮匠 发表于 2019-12-27 10:09
都是用intel2015编译的,系统倒是有CentOS7.x版本上的差别。如果多数情况下四路效率一般,那么哪种情况是 ...

大规模并行那得优化代码的,想提高利用率同时跑2个或者4个任务就行了

50

帖子

0

威望

704

eV
积分
754

Level 4 (黑子)

 楼主| 发表于 2019-12-27 21:56:29 | 显示全部楼层
biogon 发表于 2019-12-27 17:41
大规模并行那得优化代码的,想提高利用率同时跑2个或者4个任务就行了

感谢

423

帖子

0

威望

1531

eV
积分
1954

Level 5 (御坂)

发表于 2019-12-28 02:12:14 | 显示全部楼层
灰天皮匠 发表于 2019-12-27 14:58
测试结果如图,4路确实不如2路。请问有没有什么办法可以充分利用一下它的算力?

NPAR不能这么设,outcar里会有警告的,虽然不影响结果,但会花费更多时间
可以根据警告,测试一下npar的值

50

帖子

0

威望

704

eV
积分
754

Level 4 (黑子)

 楼主| 发表于 2019-12-28 09:28:28 | 显示全部楼层
hakuna 发表于 2019-12-28 02:12
NPAR不能这么设,outcar里会有警告的,虽然不影响结果,但会花费更多时间
可以根据警告,测试一下npar的 ...

之前测试目的是看内存条换成16g会提升多少,就没有测参数的影响。我改下NPAR的值再测一下,看能提升多少。感谢

423

帖子

0

威望

1531

eV
积分
1954

Level 5 (御坂)

发表于 2019-12-28 13:10:20 | 显示全部楼层
本帖最后由 hakuna 于 2019-12-28 16:55 编辑
灰天皮匠 发表于 2019-12-28 09:28
之前测试目的是看内存条换成16g会提升多少,就没有测参数的影响。我改下NPAR的值再测一下,看能提升多少 ...

可以参考一下:http://www.hector.ac.uk/support/ ... nd_npar_summary.pdf
另外,KPAR也会影响计算速度

评分

参与人数 1eV +5 收起 理由
灰天皮匠 + 5 好物!

查看全部评分

8

帖子

0

威望

34

eV
积分
42

Level 2 能力者

发表于 2020-1-4 22:32:21 | 显示全部楼层
你这个cpu挺好的,如果四路跑起来比较慢很有可能是因为体系太小。cpu之间的交流时间成了主要问题。小体系建议使用其中两个cpu,体系大的时候再上四个cpu跑吧

79

帖子

1

威望

813

eV
积分
912

Level 4 (黑子)

发表于 2020-1-21 00:11:52 | 显示全部楼层
本帖最后由 啦啦黑还黑 于 2020-1-21 00:13 编辑

用四路服务器算vasp,一个技巧,把NCORE设置成   总核数/4。
。。别用NPAR=1,计算速度比NPAR=4差得远(对于4路服务器)试试就明白了

您需要登录后才可以回帖 登录 | 现在注册!

本版积分规则

手机版|北京科音自然科学研究中心|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949-1号 )

GMT+8, 2020-4-4 23:29 , Processed in 0.193864 second(s), 27 queries .

快速回复 返回顶部 返回列表