计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2135|回复 Reply: 3
打印 Print 上一主题 Last thread 下一主题 Next thread

[使用经验] 8375c下vasp的运行速度

[复制链接 Copy URL]

81

帖子

1

威望

220

eV
积分
321

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 hgyhgy 于 2022-10-26 14:36 编辑

vasp544和vasp612似乎都没有什么优化编译余地,基本上使用-O2 -xHost好像就可以了。不知道有没有其他人能优化得到速度更快的vasp。
附件中的作业,使用的是一个节点,64cpu的8375c, 内存使用的是3200Hz的。 所用的时间是102.071s。是OUTCAR最后的elased time的数值。

我的结果是vasp544的速度比vasp612的要快。所用的vasp源代码直接在网上找的。未能找到最新版的vasp6。这个购买vasp的进展缓慢。

对于想购买8375c的,也可以参考一下我这个的计算时间。

如果有使用amd cpu的,也可以测试一下附件中的作业,看看时间相差大不大。这对于购买8375c,还是购买amd的cpu,应该是有参考价值的。

vasp612, 可以使用openmp。这个效果似乎不佳。主要是在开始的非自洽计算的几步(5步或12步)的每一步的时间会比不使用openmp的要长1倍或几倍,这样到了自洽电子步的时候,两者对于每一步所花的时间又相差不多。这样就比较难弥补开始几步造成的时间差距了,除非离子步数目特别多。

对于openmp,NCORE基本上是与OMP_NUM_THREADS相互对应的。NCORE在使用openmp的时候是不起作用的。当然实际哪一种设置更快,要具体测试。
比如若不使用openmp, NCORE=8时作业比较快的话,那么在使用openmp时,设置OMP_NUM_THREADS=8可能会比较好。

根据vaspwiki,使用openmp时,应使用类似于下面的命令运行作业。
mpirun -np 8 -genv I_MPI_PIN_DOMAIN=omp -genv I_MPI_PIN=yes -genv OMP_NUM_THREADS=8 -genv OMP_STACKSIZE=512m \
-genv OMP_PLACES=cores -genv OMP_PROC_BIND=close  vasp
对于8375c,
NSIM=4
NCORE=8
似乎是比较快。当然不同体系的最优设置可能是会有差别。附件中,使用了NSIM=8,NCORE=8。


后来,我发现这个测试时间,不能使用运行时间太短的作业。因为8375c的基础频率是2.9G,可加速到3.5G,那样短时间的作业不就等于一直运行在最高频率3.5G之下了?
所以,还是有必要使用一个运行时间长一点的作业的时间的。这个不取决于作业的大小,而取决于时间是否足够长,使得不能长期维持在频率加速的状态,那样才能看出效果。
附件001_test.tgz是5896.426s的作业,使用的是vasp6.12, openmp的版本,OMP_NUM_THREADS=8进行的。
同样的作业在海光cpu7285之下的时间是8771s。如果使用intel 2021编译,时间是9950.686s。如果使用双节点海光cpu并行,时间是4894.310s,比一个8375c快一点。
时间只是8375c的1.49倍。对于小作业,所花时间是233s, 是8375c 102s的233/102=2.28倍。
这个小作业,可能由于cpu加速效应,结果不一定可靠。


这远远好于用短时间test.tgz测试的数据。短时间作业的数据,海光的时间是8375c的2倍(102s vs 233 s)。


此外,有一个重大的问题。
对于海光cpu, intel 2021编译的速度会慢许多。对于小作业,时间是233s vs 370s.
采用intel 2020编译器,也会慢些,约290 s。
使用intel 2017或intel 2018,速度就正常。
intel comiler和mpi都要早期的版本,对于海光cpu来说,速度才行。

我自然也就像测试一下对于8375c,是否有类似现象。
问题是intel 2017-2019, 都不支持centos 8, 只支持centos 6或7。
勉强安装了后,编译vasp会出错。

是否有人能测试8375c配合intel 2017, 是否也会出现快很多的情况。所用是vasp544。






test.tgz

168.98 KB, 下载次数 Times of downloads: 37

001_test.tgz

313.45 KB, 下载次数 Times of downloads: 20

时间长一点的作业

2

帖子

0

威望

1314

eV
积分
1316

Level 4 (黑子)

2#
发表于 Post on 2022-10-22 05:30:50 | 只看该作者 Only view this author
感谢楼主分享,看起来8375c的高主频带来的单核效率提升还是很高。

刚好有空,试了试例子。全都用的NPAR=4,vasp.5.4.4也是-O2 编译,CPU均为36核。
2697V4: 351 s
6140: 278 s
6240: 278 s

这个例子不大,感觉大家也可以来一起分享下测试结果交流一下。

81

帖子

1

威望

220

eV
积分
321

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2022-10-22 11:09:08 | 只看该作者 Only view this author
本帖最后由 hgyhgy 于 2022-10-26 09:02 编辑

想知道对于intel cpu是否存在高版本编译器速度降低的问题

1236

帖子

1

威望

3495

eV
积分
4751

Level 6 (一方通行)

4#
发表于 Post on 2022-10-22 11:27:47 | 只看该作者 Only view this author
hgyhgy 发表于 2022-10-22 11:09
我测试了一下超算中心的海光cpu的服务器。第一次知道有国产cpu。
HygonGenuine Hygon C86 7285 32-core Pr ...

海光和amd是差不多的东西,在上面编vasp想快得用amd官方给的方法编译
另外上面那个例子用8352Y跑是109s

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:49 , Processed in 0.195380 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list