计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: lue611
打印 Print 上一主题 Last thread 下一主题 Next thread

[VASP] EPYC9654使用aocc+aocl编译的openmpi和vasp的问题

[复制链接 Copy URL]

32

帖子

0

威望

391

eV
积分
423

Level 3 能力者

16#
发表于 Post on 2024-5-18 22:34:44 | 只看该作者 Only view this author
rogerjun 发表于 2024-5-18 14:54
我后续就都是正常安装了。感觉你这个环境变量设置有些问题,就感觉编译出来的openmpi不是依赖clang、clan ...

您好,感谢耐心解答!
我看到您安装路径里面有aocc-4.2.0_gcc-toolset-12这一级,请问这一级是openmpi编译过程中自动生成的吗?还是您安装gcc-toolset-12时候搞的?
另外,环境变量方面您在openmpi编译前是否有什么特别的调整?
因为我的整个编译用的机子是在刚装完Rocky9.3 DVD-ISO镜像上搞得,aocc和aocl用的rpm包安装,gcc gfortran g++都是因为openmpi根据openmpi编译报错的信息才用yum安装的。理论上应该不会多出什么不必要的包,.bashrc在openmpi编译前也仅添了setenv_AOCC.sh和amd-libs.cfg的source,所以不是很明白为啥环境变量搞得一团糟。(因为不必要的都没安装的原因,我连module都没有,后面曾一度搞了个module但都没包在module list里显示)

9

帖子

0

威望

932

eV
积分
941

Level 4 (黑子)

17#
发表于 Post on 2024-5-19 11:05:01 | 只看该作者 Only view this author
本帖最后由 rogerjun 于 2024-5-20 09:43 编辑
ginlpein 发表于 2024-5-18 22:34
您好,感谢耐心解答!
我看到您安装路径里面有aocc-4.2.0_gcc-toolset-12这一级,请问这一级是openmpi编 ...

“aocc-4.2.0_gcc-toolset-12”这个目录是我为了区分不同编译方法下得到的openmpi版本所以自己设置的目录名称。环境变量方面看起来你的操作没什么问题。我觉得你可以去检查一下openmpi configure后得到的config.log文件,搜索一下Fortran或者flang之类的关键词,看看编译openmpi时flang是否成功链接上了,从你的错误信息看来,openmpi编译时可能没链接上flang,而使用了gnu的gfortran.
更新:甭纠结了兄弟,我测试了一下,核数比较少的时候(我是双路7R32和单路9654,使用<=96核),使用intel oneAPI(2024.1)编译得到的vasp6.4.2要比aocc的快得多,而且编译过程畅通无阻。也有人说核数多了之后aocc比较快的,但是核数少的时候还是oneAPI更牛。

32

帖子

0

威望

391

eV
积分
423

Level 3 能力者

18#
发表于 Post on 2024-5-20 15:35:03 | 只看该作者 Only view this author
本帖最后由 ginlpein 于 2024-5-20 15:38 编辑
rogerjun 发表于 2024-5-19 11:05
“aocc-4.2.0_gcc-toolset-12”这个目录是我为了区分不同编译方法下得到的openmpi版本所以自己设置的目录 ...

真的十分感谢您多次的解答!
log里面您flang链接成功的语句是啥?方便参考一下吗?

然后oneAPI的问题。。。其实我就是从oneAPI那边转过来的,机子到的时候有人帮忙搞了oneAPI+vasp6.3.2的组合,运行没问题,但是计算速度奇慢无比,都查不到问题在哪。。。同样插满全部内存的情况下,新机子在硬件全面升级的情况下,同一个SCF收敛任务128核并行是老机子(2019XE+2015MPI+VASP5.4.4)时间花费的10倍。。。所以这次就只能下定主意自己刷机然后自己分别走一遍AOCC和oneAPI编译的路线来测试了。

9

帖子

0

威望

932

eV
积分
941

Level 4 (黑子)

19#
发表于 Post on 2024-5-20 16:19:10 | 只看该作者 Only view this author
ginlpein 发表于 2024-5-20 15:35
真的十分感谢您多次的解答!
log里面您flang链接成功的语句是啥?方便参考一下吗?

flang链接上的信息大概是这些?
“configure:5802: *** Fortran compiler
configure:29064: checking for Fortran compiler version
configure:29073: flang --version >&5
AMD clang version 16.0.3 (CLANG: AOCC_4.2.0-Build#89 2023_12_13)”

“configure:29520: checking if Fortran compiler works
configure:29552: flang -o conftest    conftest.f  >&5
configure:29552: $? = 0
configure:29552: ./conftest
configure:29552: $? = 0
configure:29569: result: yes”

我这边测试的结果确实是oneAPI编译开启avx指令集后的vasp6.4.2速度远超aocc编译版本,郁闷中。。。现在怀疑我aocc编译漏了些参数,居然amd自己的U优化不过Intel、、、层主后续方便的话,可否提供测试算例的一些数据,我们也交流一下哪种编译速度更快的问题

34

帖子

0

威望

1082

eV
积分
1116

Level 4 (黑子)

20#
发表于 Post on 2024-7-23 04:42:36 | 只看该作者 Only view this author
rogerjun 发表于 2024-4-13 18:15
问题1:clang -v检查一下clang链接的gcc版本,我测试了一下,clang链接到gcc-12时可正常安装openmpi 5.0.x
...

请问对于问题1,安装aocc时候clang只会链接linux系统默认的那个gcc版本吗。我非root用户,但是系统里装了几个版本的gcc,我load 了gcc13但是安装之后仍然是gcc8。请问有没有好的解决办法。
越学越难顶。

3

帖子

0

威望

29

eV
积分
32

Level 2 能力者

21#
发表于 Post on 2024-9-15 19:55:40 | 只看该作者 Only view this author
请问最后一个问题解决了吗

12

帖子

0

威望

661

eV
积分
673

Level 4 (黑子)

22#
发表于 Post on 2025-1-22 19:27:49 | 只看该作者 Only view this author
双路9654+ubuntu22.04,aocc和aocl版本4.2.0,openmpi版本4.1.6(此前由于编译cp2k还存在5.0.6版本),成功实现vasp 6.4.2+vtst的编译。
同样遇到问题3,将OFLAG由-O2更改为-O3问题得以部分解决。可以正常跑计算,输出文件正常,但是仍然存在warning(-np x则报x次):
Warning: ieee_invalid is signaling
Warning: ieee_underflow is signaling
Warning: ieee_inexact is signaling
FORTRAN STOP
由于不影响正常使用暂时不打算处理,后续如出现其他异常再考虑使用oneapi。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-15 17:15 , Processed in 0.198458 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list