计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1619|回复 Reply: 8
打印 Print 上一主题 Last thread 下一主题 Next thread

[GROMACS] 请教Gromacs在AMD服务器上的Performace偏慢,是否我编译有问题?

[复制链接 Copy URL]

85

帖子

0

威望

393

eV
积分
478

Level 3 能力者

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 mgqqlwq 于 2022-12-31 01:57 编辑

最近开始使用超算上的一点资源,是AMD EYPC 7532处理器,但是同我之前Intel 8173M上的速度比较,感觉慢很多,对AMD的机器了解的比较少,想请教下是不是我AMD服务器上的Gromacs编译的选项选择不是很好,导致计算速度比较慢呢?具体的Performance和两个机器的信息如下。mdrun的选项是都使用全部使用OpenMP, thread-mpi设为1,gmx mdrun -v -deffnm XXX -ntmpi 1 -ntomp ${N}

处理器型号Intel(R) Xeon(R) Platinum 8173M, 使用56个核, Performace大约56 ns/day
FFT library:        fftw-3.3.3-sse2
C compiler:         /usr/bin/cc GNU 4.8.5
C compiler flags:    -march=core-avx2     -O3 -DNDEBUG -funroll-all-loops -fexcess-precision=fast  
C++ compiler:       /usr/bin/c++ GNU 4.8.5
C++ compiler flags:  -march=core-avx2    -std=c++11   -O3 -DNDEBUG -funroll-all-loops -fexcess-precision=fast



处理器型号AMD EPYC 7532 32-Core Processor, 使用32个核, Performace大约13.8 ns/day
FFT library:        fftw-3.3.8-sse2-avx-avx2-avx2_128
C compiler:         /compilers_and_libraries_2020.1.217/linux/bin/intel64/icc Intel 19.1.0.20200306
C compiler flags:    -march=core-avx2    -std=gnu99  -O3 -DNDEBUG -ip -funroll-all-loops -alias-const -ansi-alias -no-prec-div -fimf-domain-exclusion=14 -qoverride-limits  
C++ compiler:       /compilers_and_libraries_2020.1.217/linux/bin/intel64/icc Intel 19.1.0.20200306
C++ compiler flags:  -march=core-avx2    -std=c++11   -O3 -DNDEBUG -ip -funroll-all-loops -alias-const -ansi-alias -no-prec-div -fimf-domain-exclusion=14 -qoverride-limits


AMD EPYC 7532每个核提供的Performace大概只有8173M的45%不到的样子,请问这是我编译的问题还是正常的情况呢?



6万

帖子

99

威望

6万

eV
积分
125148

管理员

公社社长

2#
发表于 Post on 2022-12-31 02:13:08 | 只看该作者 Only view this author
一个用icc,一个用gfortran,光是这个就没有可比性
我也怀疑你写错了

对EPYC建议的gcc选项看https://prace-ri.eu/wp-content/uploads/Best-Practice-Guide_AMD.pdf的3.1.1.3节

不建议核多的情况都用OpenMP并行,效率远不如结合thread-MPI

北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

85

帖子

0

威望

393

eV
积分
478

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2022-12-31 08:49:47 | 只看该作者 Only view this author
sobereva 发表于 2022-12-31 02:13
一个用icc,一个用gfortran,光是这个就没有可比性
我也怀疑你写错了

谢谢卢老师回复!

抱歉,我不是很确定,您是指icc和gcc对吧?应该没有用到gfortran,因为AMD服务器上有icc就用icc编译了
麻烦再问下您:
1. AMD的机器Gromacs是不是推荐用gcc编译呢?icc 可能不一定好是吧?
2. 你推荐的这个文档里面的这个选项`-O3 -march=znver1 -mtune=znver1 -mfma -mavx2 -m3dnow -fomit-frame-pointer` 编译的时候应该怎么实现呢?我是参考您的457博文编译的
3. 如果参考您的博文用cmake .. -DCMAKE_INSTALL_PREFIX=/xxx/gmx2018.8 -DGMX_SIMD=AVX2_128来编译的话可以吗?
4. fftw的编译选项重要吗?AMD机器上我也是用icc编译的

另外谢谢您的建议!OpenMP和thread-MPI的选项我再试试

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

4#
发表于 Post on 2022-12-31 09:19:01 | 只看该作者 Only view this author
https://developer.amd.com/wp-con ... ser%20Guide_2.1.pdf
Check out AMD Optimized CPU Libraries.

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

85

帖子

0

威望

393

eV
积分
478

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2022-12-31 12:36:23 | 只看该作者 Only view this author
abin 发表于 2022-12-31 09:19
https://developer.amd.com/wp-content/resources/AOCL_User%20Guide_2.1.pdf
Check out AMD Optimized CP ...

谢谢您的回复!
还想麻烦跟您确认下,我可以参考这个编译fftw对吧?

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

6#
发表于 Post on 2022-12-31 13:20:53 | 只看该作者 Only view this author
mgqqlwq 发表于 2022-12-31 12:36
谢谢您的回复!
还想麻烦跟您确认下,我可以参考这个编译fftw对吧?

自己动手吧。
我给你的信息是AMD官方推荐的方案。

至于具体能干啥,有啥用,自己捣鼓吧。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

6万

帖子

99

威望

6万

eV
积分
125148

管理员

公社社长

7#
发表于 Post on 2022-12-31 17:22:48 | 只看该作者 Only view this author
mgqqlwq 发表于 2022-12-31 08:49
谢谢卢老师回复!

抱歉,我不是很确定,您是指icc和gcc对吧?应该没有用到gfortran,因为AMD服务器上 ...

是gcc,笔误

对于编译gmx,用icc比linux自带的gcc没有额外的好处。反正我从来不用icc编译

你用gcc直接按http://sobereva.com/457里说的重新编译一次。一般不需要自己手动加什么选项,自动就会用比较合适的编译设置。

FFTW库对PME的静电相互作用计算效率有决定性的影响。

不是说icc编译不行,只是说你要公平地对比硬件性能应当先把软件方面能统一的都统一了,免得引入额外因素的影响。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

85

帖子

0

威望

393

eV
积分
478

Level 3 能力者

8#
 楼主 Author| 发表于 Post on 2023-1-1 06:06:29 | 只看该作者 Only view this author
abin 发表于 2022-12-31 13:20
自己动手吧。
我给你的信息是AMD官方推荐的方案。

好的,非常非常感谢!

85

帖子

0

威望

393

eV
积分
478

Level 3 能力者

9#
 楼主 Author| 发表于 Post on 2023-1-1 06:08:40 | 只看该作者 Only view this author
sobereva 发表于 2022-12-31 17:22
是gcc,笔误

对于编译gmx,用icc比linux自带的gcc没有额外的好处。反正我从来不用icc编译

谢谢卢老师!
我按照457博文用gcc编译次试试,比较下速度。
我之前按照457博文编译的时候,其他的都没啥,就是SIMD这个我是的两个cluster上好像都不能自动识别出来,需要自己指定。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-23 01:43 , Processed in 0.155729 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list