计算化学公社

标题: 四路的服务器跑vasp效率怎么样 [打印本页]

作者
Author:
灰天皮匠    时间: 2019-12-26 20:45
标题: 四路的服务器跑vasp效率怎么样
本帖最后由 灰天皮匠 于 2019-12-26 21:09 编辑

前段时间课题组买了一台四路的服务器用来跑vasp,配置如下:
CPU Intel Xeon 6148 *4
内存 三星DDR4 RECC 2666MHz 8g*24

一开始还没发觉什么问题,后来用服务器的同学说不如双路的旧服务器快,算的体系大概100个原子左右。于是将8g内存条换成16g的,发现单个任务的提升也就是11~13%。两个算例一起提交用的核数多的任务反而会被拉低,和核数少的算例一起结束。

不知道各位老师同学有没有过组四路跑vasp的经验可以分享一下,是配置不合理还是软件不适合四路,也有可能是我的测试方法有问题

最主要的还是看看有没有提升效率的方法,不太想浪费那么多核数,最后跑出来和双路一样的效果。

作者
Author:
biogon    时间: 2019-12-27 10:01
双路四路运行环境一样吗,不过四路效率本来就是不行
作者
Author:
灰天皮匠    时间: 2019-12-27 10:09
biogon 发表于 2019-12-27 10:01
双路四路运行环境一样吗,不过四路效率本来就是不行

都是用intel2015编译的,系统倒是有CentOS7.x版本上的差别。如果多数情况下四路效率一般,那么哪种情况是会优于双路的计算效果呢?就是说,想充分发挥它的性能的话,您有没有一些比较好的建议
作者
Author:
pwzhou    时间: 2019-12-27 14:19
考虑一下vasp的并行效率,你在4路的服务器上测试一下用1路、2路、3路、4路跑同一个作业测试一下,看看哪个加速比最好,也许你4路的还没3路甚至两路的快。
作者
Author:
灰天皮匠    时间: 2019-12-27 14:58
pwzhou 发表于 2019-12-27 14:19
考虑一下vasp的并行效率,你在4路的服务器上测试一下用1路、2路、3路、4路跑同一个作业测试一下,看看哪个 ...

测试结果如图,4路确实不如2路。请问有没有什么办法可以充分利用一下它的算力?
作者
Author:
pwzhou    时间: 2019-12-27 15:07
灰天皮匠 发表于 2019-12-27 14:58
测试结果如图,4路确实不如2路。请问有没有什么办法可以充分利用一下它的算力?

这种情况同时跑两个双路的作业应该是比较好的选择,当作业很大,两路算不动的时候,再用4路去跑。
作者
Author:
灰天皮匠    时间: 2019-12-27 15:18
pwzhou 发表于 2019-12-27 15:07
这种情况同时跑两个双路的作业应该是比较好的选择,当作业很大,两路算不动的时候,再用4路去跑。

只看图中的测试结果的话,同时跑两个双路有时甚至不如一个任务一个任务地算
不过这也是没办法中的办法感谢
作者
Author:
pwzhou    时间: 2019-12-27 15:22
灰天皮匠 发表于 2019-12-27 15:18
只看图中的测试结果的话,同时跑两个双路有时甚至不如一个任务一个任务地算
不过这也是没办法中的办 ...

实际上就是这样,每个软件的并行效率都是有限的,所以很多时候不是核数越多越快,有的软件并行效率很差的时候,比如用molpro算CASSCF如果体系很大,活化空间比较大,用单核算是最快的。软件的并行效率我们一般是没啥办法的,所以就去测试一下,看看核数多少加速比最好,那么就选择这个即可。
作者
Author:
biogon    时间: 2019-12-27 17:41
灰天皮匠 发表于 2019-12-27 10:09
都是用intel2015编译的,系统倒是有CentOS7.x版本上的差别。如果多数情况下四路效率一般,那么哪种情况是 ...

大规模并行那得优化代码的,想提高利用率同时跑2个或者4个任务就行了

作者
Author:
灰天皮匠    时间: 2019-12-27 21:56
biogon 发表于 2019-12-27 17:41
大规模并行那得优化代码的,想提高利用率同时跑2个或者4个任务就行了

感谢
作者
Author:
hakuna    时间: 2019-12-28 02:12
灰天皮匠 发表于 2019-12-27 14:58
测试结果如图,4路确实不如2路。请问有没有什么办法可以充分利用一下它的算力?

NPAR不能这么设,outcar里会有警告的,虽然不影响结果,但会花费更多时间
可以根据警告,测试一下npar的值
作者
Author:
灰天皮匠    时间: 2019-12-28 09:28
hakuna 发表于 2019-12-28 02:12
NPAR不能这么设,outcar里会有警告的,虽然不影响结果,但会花费更多时间
可以根据警告,测试一下npar的 ...

之前测试目的是看内存条换成16g会提升多少,就没有测参数的影响。我改下NPAR的值再测一下,看能提升多少。感谢
作者
Author:
hakuna    时间: 2019-12-28 13:10
本帖最后由 hakuna 于 2019-12-28 16:55 编辑
灰天皮匠 发表于 2019-12-28 09:28
之前测试目的是看内存条换成16g会提升多少,就没有测参数的影响。我改下NPAR的值再测一下,看能提升多少 ...

可以参考一下:http://www.hector.ac.uk/support/ ... nd_npar_summary.pdf
另外,KPAR也会影响计算速度

作者
Author:
llzz0309    时间: 2020-1-4 22:32
你这个cpu挺好的,如果四路跑起来比较慢很有可能是因为体系太小。cpu之间的交流时间成了主要问题。小体系建议使用其中两个cpu,体系大的时候再上四个cpu跑吧
作者
Author:
啦啦黑还黑    时间: 2020-1-21 00:11
本帖最后由 啦啦黑还黑 于 2020-1-21 00:13 编辑

用四路服务器算vasp,一个技巧,把NCORE设置成   总核数/4。
。。别用NPAR=1,计算速度比NPAR=4差得远(对于4路服务器)试试就明白了






欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3