计算化学公社

标题: 7B13安装VASP6.4.1体验 [打印本页]

作者
Author:
fantexi113    时间: 2023-9-13 09:41
标题: 7B13安装VASP6.4.1体验
本帖最后由 fantexi113 于 2023-9-13 09:41 编辑

最近组装了一台3代EPYC,主要用于VASP计算。配置如下:

CPU:7B13
主板:技嘉MZ32-AR0
内存:32*8 2666v (超频到3200使用)
硬盘:PM9a3 1.92t

使用了三种方法安装VASP6.4.1:

1. AOOC 3.2.0 + AOCL(基于AOOC3.2.0) + OpenMPI 4.1.4,系统Rocky Linux 9.2,参考:https://zhuanlan.zhihu.com/p/557466113http://bbs.keinsci.com/thread-37137-1-1.html

最终编译成功了,但是运行效率奇慢,可能编译过程哪个地方有错误,找不到原因,遂放弃。


2. Intel OneAPI 2023.1,系统Rocky Linux 9.2,参考:https://www.jianshu.com/p/54c7d105ce20

编译比较顺利,vtst也编译成功。但是不支持export MKL_DEBUG_CPU_TYPE=5命令加速。

3. Intel_Parallel_Studio_XE_2018_update0,系统CentOS 7-2009,参考:http://.cn/schemedetails-288.htmlhttp://.cn/schemedetails-302.htmlhttps://www.jianshu.com/p/54c7d105ce20https://www.jianshu.com/p/4a75e0efe8c4

编译比较顺利,vtst也编译成功。支持export MKL_DEBUG_CPU_TYPE=5命令加速。
但是系统换成Rocky Linux 9.2,编译老是报错,估计是gcc版本太新的原因,参考https://www.jianshu.com/p/4a75e0efe8c4,应该也可以安装,后面没有尝试。


第1种论坛有人已经测试过没问题,但是我安装后就运行效率非常慢,也没找到原因。
Intel_Parallel_Studio_XE和OneAPI,这个大神已经测试对比过(https://www.jianshu.com/p/4a75e0efe8c4),Intel_Parallel_Studio_XE_2018和2016比OneAPI效率高,我测试的也是如此,只是我测试2018和2016版本差异不大。Intel_Parallel_Studio_XE_2016在CentOS下安装不上vtst,所以目前使用Intel_Parallel_Studio_XE_2018。

目前3代EPYC,建议Intel_Parallel_Studio_XE_2018或2016安装VASP,系统建议CentOS 7-2009。CentOS 7记得开启睿频,默认不开启。Rocky Linux 9.2默认是开启睿频的。


测试结果:xe2018_vasp641vtst_36_vtst:25845s(Total CPU time used)- 24984s (User time)
                oneapi2023_vasp641vtst_36_vtst:32417s - 26686s,主要是系统时间很长。

测试不太严谨,有时间再补一下CentOS + oneapi2023的测试。

有个疑问,CPU是7B13,64核128线程,试过32核、36核和48核运行,36核速度最快。这个vasp并行效率有点摸不到头脑,初学,还请不吝赐教。

作者
Author:
Weldingspock    时间: 2023-9-13 10:11
请问一下export MKL_DEBUG_CPU_TYPE=5这个加速的来源是哪里呢?是不是只支持oneapi
作者
Author:
fantexi113    时间: 2023-9-13 10:47
Weldingspock 发表于 2023-9-13 10:11
请问一下export MKL_DEBUG_CPU_TYPE=5这个加速的来源是哪里呢?是不是只支持oneapi

http://.cn/schemedetails-288.htmlhttp://.cn/schemedetails-302.htmlhttp://bbs.keinsci.com/thread-36834-1-1.html
这三个帖子,对OneAPI没效果,对XE2016-2018有效果
作者
Author:
wypkdhd    时间: 2023-9-13 12:32
您好,可以了请您帮忙去那个36834帖子里面测试一下你这边编译的最快的方式,在50个Hg原子和我那个NiO的速度,方便各位兄弟进一步优化计算速度。
作者
Author:
1030266769    时间: 2023-10-11 21:36
大佬可以求一下Intel_Parallel_Studio_XE_2018_update0这个编译器嘛,目前试过aocc和aocl安装、spack安装 都失败了也不知道为什么, 想求一下Intel_Parallel_Studio_XE_2018_update0这个编译器
作者
Author:
1030266769    时间: 2023-10-11 21:37
wypkdhd 发表于 2023-9-13 12:32
您好,可以了请您帮忙去那个36834帖子里面测试一下你这边编译的最快的方式,在50个Hg原子和我那个NiO的速度 ...

大佬有amd安装vasp的经验嘛,目前试过aocc和aocl安装、spack安装 都失败了也不知道为什么,
可以提供测试 我的服务器是7B13

作者
Author:
wypkdhd    时间: 2023-10-11 23:01
1030266769 发表于 2023-10-11 21:37
大佬有amd安装vasp的经验嘛,目前试过aocc和aocl安装、spack安装 都失败了也不知道为什么,
可以提 ...

7B13我帖子里有,就按intel的编译方式搞就完事了。
作者
Author:
hersvim    时间: 2023-10-22 23:10
米兰不建议用CentOS 7这么老的系统和内核了
作者
Author:
fantexi113    时间: 2023-10-25 11:47
wypkdhd 发表于 2023-9-13 12:32
您好,可以了请您帮忙去那个36834帖子里面测试一下你这边编译的最快的方式,在50个Hg原子和我那个NiO的速度 ...

用的站长50Hg原子测试的,用的incar-long,超线程没关,一直困惑,32以上还变慢了。

4核
(, 下载次数 Times of downloads: 29)

8核
(, 下载次数 Times of downloads: 32)

16核
(, 下载次数 Times of downloads: 32)

32核
(, 下载次数 Times of downloads: 32)

48核
(, 下载次数 Times of downloads: 31)

64核
(, 下载次数 Times of downloads: 38)

作者
Author:
fantexi113    时间: 2023-10-25 11:48
1030266769 发表于 2023-10-11 21:36
大佬可以求一下Intel_Parallel_Studio_XE_2018_update0这个编译器嘛,目前试过aocc和aocl安装、spack安装  ...

链接: https://pan.baidu.com/s/1V2jKlogWfVLgHjeqxc0Qiw 提取码: 97x9 复制这段内容后打开百度网盘手机App,操作更方便哦
作者
Author:
fantexi113    时间: 2023-10-25 11:51
hersvim 发表于 2023-10-22 23:10
米兰不建议用CentOS 7这么老的系统和内核了

用新的系统装Intel_Parallel_Studio_XE_2018_update0老是出问题,所以用CentOS 7了,内核升级到了6.5.2-1.el7.elrepo.x86_64,目前用着还行
作者
Author:
wypkdhd    时间: 2023-10-25 21:30
fantexi113 发表于 2023-10-25 11:47
用的站长50Hg原子测试的,用的incar-long,超线程没关,一直困惑,32以上还变慢了。

4核

收到,万分感谢。
作者
Author:
comchem    时间: 2023-10-25 22:24
谢谢分享。
作者
Author:
Janus    时间: 2023-11-2 08:44
fantexi113 发表于 2023-10-25 11:47
用的站长50Hg原子测试的,用的incar-long,超线程没关,一直困惑,32以上还变慢了。

4核

LOOP时间太短。建议最低的搞20-30s/LOOP step的任务。太短的时间,计算速度的瓶颈不在CPU那儿
作者
Author:
这是神马事    时间: 2023-11-4 09:41
给大家提供一个AOCC+AOCL编译的参考:同样的7b13,用aocc+aocl编译vasp5.4.4,50原子Hg测试,性能比楼主的intel慢20%左右,供大家参考
作者
Author:
wypkdhd    时间: 2023-11-7 17:59
这是神马事 发表于 2023-11-4 09:41
给大家提供一个AOCC+AOCL编译的参考:同样的7b13,用aocc+aocl编译vasp5.4.4,50原子Hg测试,性能比楼主的i ...

我用intel 2019 vasp5.4.4 amd 7543 8核速度和楼主4核速度一样。
作者
Author:
wypkdhd    时间: 2023-11-7 18:00
请教楼主,“系统建议CentOS 7-2009。CentOS 7记得开启睿频,默认不开启。”这句话实际如何操作?
作者
Author:
fantexi113    时间: 2023-11-8 10:22
本帖最后由 fantexi113 于 2023-11-8 10:24 编辑
wypkdhd 发表于 2023-11-7 18:00
请教楼主,“系统建议CentOS 7-2009。CentOS 7记得开启睿频,默认不开启。”这句话实际如何操作?

参考这个帖子:http://.cn/schemedetails-288.html

S1:  升级linux内核使其更好地支持7742

uname -r    #查看内核版本,若内核版本低于4.0则需要进行内核升级

rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org #导入ELRepo源公共密钥

rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm #安装ELRepo源

yum --enablerepo=elrepo-kernel install kernel-ml #安装最新linux内核

grub2-mkconfig -o /boot/grub2/grub.cfg #重建内核启动配置文件

grub2-set-default 0 #设置新安装的内核默认启动(新安装的内核在内核顺序中一般为0)

reboot #重启后用uname -r验证内核是否升级成功



S2:  开启7742睿频

cat /proc/cpuinfo | grep MHz #查看cpu的主频(睿频未开启前,或者内核未升级前,主频处于1500-2500MHz之间)

yum install cpupowerutils #安装cpupower

cpupower  frequency-set -g performance #设置cpu模式为性能模式
作者
Author:
fantexi113    时间: 2023-11-8 10:25
本帖最后由 fantexi113 于 2023-11-8 10:27 编辑
fantexi113 发表于 2023-11-8 10:22
参考这个帖子:http://.cn/schemedetails-288.html

S1:  升级linux内核使其更好地支持7742

cn前还有一个词,自动屏蔽了




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3