计算化学公社

标题: 8375c下vasp的运行速度 [打印本页]

作者
Author:
hgyhgy    时间: 2022-10-21 23:08
标题: 8375c下vasp的运行速度
本帖最后由 hgyhgy 于 2022-10-26 14:36 编辑

vasp544和vasp612似乎都没有什么优化编译余地,基本上使用-O2 -xHost好像就可以了。不知道有没有其他人能优化得到速度更快的vasp。
附件中的作业,使用的是一个节点,64cpu的8375c, 内存使用的是3200Hz的。 所用的时间是102.071s。是OUTCAR最后的elased time的数值。

我的结果是vasp544的速度比vasp612的要快。所用的vasp源代码直接在网上找的。未能找到最新版的vasp6。这个购买vasp的进展缓慢。

对于想购买8375c的,也可以参考一下我这个的计算时间。

如果有使用amd cpu的,也可以测试一下附件中的作业,看看时间相差大不大。这对于购买8375c,还是购买amd的cpu,应该是有参考价值的。

vasp612, 可以使用openmp。这个效果似乎不佳。主要是在开始的非自洽计算的几步(5步或12步)的每一步的时间会比不使用openmp的要长1倍或几倍,这样到了自洽电子步的时候,两者对于每一步所花的时间又相差不多。这样就比较难弥补开始几步造成的时间差距了,除非离子步数目特别多。

对于openmp,NCORE基本上是与OMP_NUM_THREADS相互对应的。NCORE在使用openmp的时候是不起作用的。当然实际哪一种设置更快,要具体测试。
比如若不使用openmp, NCORE=8时作业比较快的话,那么在使用openmp时,设置OMP_NUM_THREADS=8可能会比较好。

根据vaspwiki,使用openmp时,应使用类似于下面的命令运行作业。
mpirun -np 8 -genv I_MPI_PIN_DOMAIN=omp -genv I_MPI_PIN=yes -genv OMP_NUM_THREADS=8 -genv OMP_STACKSIZE=512m \
-genv OMP_PLACES=cores -genv OMP_PROC_BIND=close  vasp
对于8375c,
NSIM=4
NCORE=8
似乎是比较快。当然不同体系的最优设置可能是会有差别。附件中,使用了NSIM=8,NCORE=8。


后来,我发现这个测试时间,不能使用运行时间太短的作业。因为8375c的基础频率是2.9G,可加速到3.5G,那样短时间的作业不就等于一直运行在最高频率3.5G之下了?
所以,还是有必要使用一个运行时间长一点的作业的时间的。这个不取决于作业的大小,而取决于时间是否足够长,使得不能长期维持在频率加速的状态,那样才能看出效果。
附件001_test.tgz是5896.426s的作业,使用的是vasp6.12, openmp的版本,OMP_NUM_THREADS=8进行的。
同样的作业在海光cpu7285之下的时间是8771s。如果使用intel 2021编译,时间是9950.686s。如果使用双节点海光cpu并行,时间是4894.310s,比一个8375c快一点。
时间只是8375c的1.49倍。对于小作业,所花时间是233s, 是8375c 102s的233/102=2.28倍。
这个小作业,可能由于cpu加速效应,结果不一定可靠。


这远远好于用短时间test.tgz测试的数据。短时间作业的数据,海光的时间是8375c的2倍(102s vs 233 s)。


此外,有一个重大的问题。
对于海光cpu, intel 2021编译的速度会慢许多。对于小作业,时间是233s vs 370s.
采用intel 2020编译器,也会慢些,约290 s。
使用intel 2017或intel 2018,速度就正常。
intel comiler和mpi都要早期的版本,对于海光cpu来说,速度才行。

我自然也就像测试一下对于8375c,是否有类似现象。
问题是intel 2017-2019, 都不支持centos 8, 只支持centos 6或7。
勉强安装了后,编译vasp会出错。

是否有人能测试8375c配合intel 2017, 是否也会出现快很多的情况。所用是vasp544。







作者
Author:
ak949    时间: 2022-10-22 05:30
感谢楼主分享,看起来8375c的高主频带来的单核效率提升还是很高。

刚好有空,试了试例子。全都用的NPAR=4,vasp.5.4.4也是-O2 编译,CPU均为36核。
2697V4: 351 s
6140: 278 s
6240: 278 s

这个例子不大,感觉大家也可以来一起分享下测试结果交流一下。
作者
Author:
hgyhgy    时间: 2022-10-22 11:09
本帖最后由 hgyhgy 于 2022-10-26 09:02 编辑

想知道对于intel cpu是否存在高版本编译器速度降低的问题
作者
Author:
biogon    时间: 2022-10-22 11:27
hgyhgy 发表于 2022-10-22 11:09
我测试了一下超算中心的海光cpu的服务器。第一次知道有国产cpu。
HygonGenuine Hygon C86 7285 32-core Pr ...

海光和amd是差不多的东西,在上面编vasp想快得用amd官方给的方法编译
另外上面那个例子用8352Y跑是109s




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3