计算化学公社

 找回密码 Forget password
 注册 Register
Views: 4311|回复 Reply: 18
打印 Print 上一主题 Last thread 下一主题 Next thread

[使用经验] 7B13安装VASP6.4.1体验

[复制链接 Copy URL]

19

帖子

0

威望

367

eV
积分
386

Level 3 能力者

本帖最后由 fantexi113 于 2023-9-13 09:41 编辑

最近组装了一台3代EPYC,主要用于VASP计算。配置如下:

CPU:7B13
主板:技嘉MZ32-AR0
内存:32*8 2666v (超频到3200使用)
硬盘:PM9a3 1.92t

使用了三种方法安装VASP6.4.1:

1. AOOC 3.2.0 + AOCL(基于AOOC3.2.0) + OpenMPI 4.1.4,系统Rocky Linux 9.2,参考:https://zhuanlan.zhihu.com/p/557466113http://bbs.keinsci.com/thread-37137-1-1.html

最终编译成功了,但是运行效率奇慢,可能编译过程哪个地方有错误,找不到原因,遂放弃。


2. Intel OneAPI 2023.1,系统Rocky Linux 9.2,参考:https://www.jianshu.com/p/54c7d105ce20

编译比较顺利,vtst也编译成功。但是不支持export MKL_DEBUG_CPU_TYPE=5命令加速。

3. Intel_Parallel_Studio_XE_2018_update0,系统CentOS 7-2009,参考:http://.cn/schemedetails-288.htmlhttp://.cn/schemedetails-302.htmlhttps://www.jianshu.com/p/54c7d105ce20https://www.jianshu.com/p/4a75e0efe8c4

编译比较顺利,vtst也编译成功。支持export MKL_DEBUG_CPU_TYPE=5命令加速。
但是系统换成Rocky Linux 9.2,编译老是报错,估计是gcc版本太新的原因,参考https://www.jianshu.com/p/4a75e0efe8c4,应该也可以安装,后面没有尝试。


第1种论坛有人已经测试过没问题,但是我安装后就运行效率非常慢,也没找到原因。
Intel_Parallel_Studio_XE和OneAPI,这个大神已经测试对比过(https://www.jianshu.com/p/4a75e0efe8c4),Intel_Parallel_Studio_XE_2018和2016比OneAPI效率高,我测试的也是如此,只是我测试2018和2016版本差异不大。Intel_Parallel_Studio_XE_2016在CentOS下安装不上vtst,所以目前使用Intel_Parallel_Studio_XE_2018。

目前3代EPYC,建议Intel_Parallel_Studio_XE_2018或2016安装VASP,系统建议CentOS 7-2009。CentOS 7记得开启睿频,默认不开启。Rocky Linux 9.2默认是开启睿频的。


测试结果:xe2018_vasp641vtst_36_vtst:25845s(Total CPU time used)- 24984s (User time)
                oneapi2023_vasp641vtst_36_vtst:32417s - 26686s,主要是系统时间很长。

测试不太严谨,有时间再补一下CentOS + oneapi2023的测试。

有个疑问,CPU是7B13,64核128线程,试过32核、36核和48核运行,36核速度最快。这个vasp并行效率有点摸不到头脑,初学,还请不吝赐教。

评分 Rate

参与人数
Participants 1
eV +5 收起 理由
Reason
Picardo + 5 谢谢

查看全部评分 View all ratings

197

帖子

1

威望

1104

eV
积分
1321

Level 4 (黑子)

2#
发表于 Post on 2023-9-13 10:11:02 | 只看该作者 Only view this author
请问一下export MKL_DEBUG_CPU_TYPE=5这个加速的来源是哪里呢?是不是只支持oneapi

19

帖子

0

威望

367

eV
积分
386

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2023-9-13 10:47:46 | 只看该作者 Only view this author
Weldingspock 发表于 2023-9-13 10:11
请问一下export MKL_DEBUG_CPU_TYPE=5这个加速的来源是哪里呢?是不是只支持oneapi

http://.cn/schemedetails-288.htmlhttp://.cn/schemedetails-302.htmlhttp://bbs.keinsci.com/thread-36834-1-1.html
这三个帖子,对OneAPI没效果,对XE2016-2018有效果

279

帖子

2

威望

4421

eV
积分
4740

Level 6 (一方通行)

打脸只许打一次

4#
发表于 Post on 2023-9-13 12:32:38 | 只看该作者 Only view this author
您好,可以了请您帮忙去那个36834帖子里面测试一下你这边编译的最快的方式,在50个Hg原子和我那个NiO的速度,方便各位兄弟进一步优化计算速度。

24

帖子

0

威望

174

eV
积分
198

Level 3 能力者

5#
发表于 Post on 2023-10-11 21:36:47 | 只看该作者 Only view this author
大佬可以求一下Intel_Parallel_Studio_XE_2018_update0这个编译器嘛,目前试过aocc和aocl安装、spack安装 都失败了也不知道为什么, 想求一下Intel_Parallel_Studio_XE_2018_update0这个编译器

24

帖子

0

威望

174

eV
积分
198

Level 3 能力者

6#
发表于 Post on 2023-10-11 21:37:30 | 只看该作者 Only view this author
wypkdhd 发表于 2023-9-13 12:32
您好,可以了请您帮忙去那个36834帖子里面测试一下你这边编译的最快的方式,在50个Hg原子和我那个NiO的速度 ...

大佬有amd安装vasp的经验嘛,目前试过aocc和aocl安装、spack安装 都失败了也不知道为什么,
可以提供测试 我的服务器是7B13

279

帖子

2

威望

4421

eV
积分
4740

Level 6 (一方通行)

打脸只许打一次

7#
发表于 Post on 2023-10-11 23:01:34 | 只看该作者 Only view this author
1030266769 发表于 2023-10-11 21:37
大佬有amd安装vasp的经验嘛,目前试过aocc和aocl安装、spack安装 都失败了也不知道为什么,
可以提 ...

7B13我帖子里有,就按intel的编译方式搞就完事了。

41

帖子

0

威望

363

eV
积分
404

Level 3 能力者

8#
发表于 Post on 2023-10-22 23:10:22 | 只看该作者 Only view this author
米兰不建议用CentOS 7这么老的系统和内核了

19

帖子

0

威望

367

eV
积分
386

Level 3 能力者

9#
 楼主 Author| 发表于 Post on 2023-10-25 11:47:05 | 只看该作者 Only view this author
wypkdhd 发表于 2023-9-13 12:32
您好,可以了请您帮忙去那个36834帖子里面测试一下你这边编译的最快的方式,在50个Hg原子和我那个NiO的速度 ...

用的站长50Hg原子测试的,用的incar-long,超线程没关,一直困惑,32以上还变慢了。

4核


8核


16核


32核


48核


64核

19

帖子

0

威望

367

eV
积分
386

Level 3 能力者

10#
 楼主 Author| 发表于 Post on 2023-10-25 11:48:35 | 只看该作者 Only view this author
1030266769 发表于 2023-10-11 21:36
大佬可以求一下Intel_Parallel_Studio_XE_2018_update0这个编译器嘛,目前试过aocc和aocl安装、spack安装  ...

链接: https://pan.baidu.com/s/1V2jKlogWfVLgHjeqxc0Qiw 提取码: 97x9 复制这段内容后打开百度网盘手机App,操作更方便哦

19

帖子

0

威望

367

eV
积分
386

Level 3 能力者

11#
 楼主 Author| 发表于 Post on 2023-10-25 11:51:10 | 只看该作者 Only view this author
hersvim 发表于 2023-10-22 23:10
米兰不建议用CentOS 7这么老的系统和内核了

用新的系统装Intel_Parallel_Studio_XE_2018_update0老是出问题,所以用CentOS 7了,内核升级到了6.5.2-1.el7.elrepo.x86_64,目前用着还行

279

帖子

2

威望

4421

eV
积分
4740

Level 6 (一方通行)

打脸只许打一次

12#
发表于 Post on 2023-10-25 21:30:20 | 只看该作者 Only view this author
fantexi113 发表于 2023-10-25 11:47
用的站长50Hg原子测试的,用的incar-long,超线程没关,一直困惑,32以上还变慢了。

4核

收到,万分感谢。

44

帖子

0

威望

519

eV
积分
563

Level 4 (黑子)

13#
发表于 Post on 2023-10-25 22:24:26 | 只看该作者 Only view this author
谢谢分享。

34

帖子

0

威望

313

eV
积分
347

Level 3 能力者

14#
发表于 Post on 2023-11-2 08:44:22 | 只看该作者 Only view this author
fantexi113 发表于 2023-10-25 11:47
用的站长50Hg原子测试的,用的incar-long,超线程没关,一直困惑,32以上还变慢了。

4核

LOOP时间太短。建议最低的搞20-30s/LOOP step的任务。太短的时间,计算速度的瓶颈不在CPU那儿

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
zmjsce + 1 我很赞同

查看全部评分 View all ratings

4

帖子

0

威望

195

eV
积分
199

Level 3 能力者

15#
发表于 Post on 2023-11-4 09:41:28 | 只看该作者 Only view this author
给大家提供一个AOCC+AOCL编译的参考:同样的7b13,用aocc+aocl编译vasp5.4.4,50原子Hg测试,性能比楼主的intel慢20%左右,供大家参考

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 12:15 , Processed in 0.226866 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list