计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: 喵星大佬
打印 Print 上一主题 Last thread 下一主题 Next thread

[Quantum ESPRESSO] CentOS下GPU加速版QE的编译安装

[复制链接 Copy URL]

1633

帖子

4

威望

4088

eV
积分
5801

Level 6 (一方通行)

喵星人

31#
 楼主 Author| 发表于 Post on 2021-12-6 23:44:43 | 只看该作者 Only view this author
本帖最后由 喵星大佬 于 2021-12-9 05:23 编辑
kuangll 发表于 2021-12-6 21:30
还是石墨炔算例,补充一个A100 40GB单卡测试结果, 运行时间284.18s,相比前面V100提升1.6倍。(注:使用了 ...

如果仅以这个例子的速度来看,一块A100近6W,由于跑的时候CPU基本在瞧所以成本上不计入,24核的2678V3加上内存和板子算近8000,近似算8倍价格。即使不考虑并行效率要达到这个速度也要6倍左右,这样看来专业卡的性价比反而并不算低。
按照Nvidia官方的测试,QE在4*A100上能做到相对于2代黄金双路36核15倍的速度提升(SXM版,4*PCIe版为11倍)

其实在Gromacs的时候发现了,按照官方的测试,A100的速度明显快于A40(A6000),所以显然也快与3090,多卡并行方面更加明显,显然是因为更好的NVLink的优势,跑单任务速度扩展性相对于一般游戏卡好得多。当然价格肯定还是高的多的,就看手头有多少了

相关测试结果可以看这里

https://developer.nvidia.com/hpc-application-performance

14

帖子

0

威望

27

eV
积分
41

Level 2 能力者

32#
发表于 Post on 2022-11-28 14:32:36 | 只看该作者 Only view this author
楼主好,请问一下,为什么我按照您这个方法安装,在configure的时候总是退出啊?提示是:
............
setting LDFLAGS... -g -pthread -fopenmp
checking for Fortran flag to compile .f90 files... (cached) none
checking whether Fortran compiler accepts -Mcuda=cuda11.8... no
configure: error: You do not have the cudafor module. Are you using NVHPC compiler?

10

帖子

0

威望

77

eV
积分
87

Level 2 能力者

33#
发表于 Post on 2022-12-4 15:57:33 | 只看该作者 Only view this author
hzliew 发表于 2022-11-28 14:32
楼主好,请问一下,为什么我按照您这个方法安装,在configure的时候总是退出啊?提示是:
............
s ...

CUDA环境没有配置好,请检查以下是否已经把nvidia hpc sdk的套件添加到环境变量中。nvcc --version/pgcc --version是否有返回信息?或者改用module来调用cuda 环境。

14

帖子

0

威望

27

eV
积分
41

Level 2 能力者

34#
发表于 Post on 2023-1-18 19:06:30 | 只看该作者 Only view this author
nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Sep_21_10:33:58_PDT_2022
Cuda compilation tools, release 11.8, V11.8.89
Build cuda_11.8.r11.8/compiler.31833905_0
pgcc --version

pgcc (aka nvc) 22.11-0 64-bit target on x86-64 Linux -tp haswell
PGI Compilers and Tools
Copyright (c) 2022, NVIDIA CORPORATION & AFFILIATES.  All rights reserved.

包括nvcc,nvfortran,等等,都有版本显示。
但始终提示出错:
                    Sets the limit of stack variables in a procedure or kernel, in KB
    ptxinfo         Print ptxas information
    [no]unroll      Enable automatic inner loop unrolling (default at -O3)
    [no]managed     Use CUDA Managed Memory
    beta            Enable beta code generation features
    autocompare     Automatically compare OpenACC CPU/GPU results: implies redundant
    redundant       Redundant OpenACC CPU/GPU execution
    [no]implicitsections
                    Implicitly convert array element to array section in OpenMP or OpenACC data clauses
make[1]: *** [../make.inc:16:parallel_include.o] 错误 1
make[1]: 离开目录“/home/hz/Downloads/qe-7.1/UtilXlib”
make: *** [Makefile:209:libutil] 错误 1

不知道是何故?

83

帖子

2

威望

3015

eV
积分
3138

Level 5 (御坂)

35#
发表于 Post on 2024-2-21 14:15:00 | 只看该作者 Only view this author
hzliew 发表于 2022-11-28 14:32
楼主好,请问一下,为什么我按照您这个方法安装,在configure的时候总是退出啊?提示是:
............
s ...

这个错误大概率是因为./configure使用的还是gfortran,而非nvfortran,尽量使用最新的nvhpc。在./configure之前确保已加载了nvhpc。
  1. module load nvhpc/23.11
  2. export PATH=/home/software/apps/nvidia/hpc_sdk/23.11/Linux_x86_64/23.11/compilers/bin:$PATH
  3. export MANPATH=/home/software/apps/nvidia/hpc_sdk/23.11/Linux_x86_64/23.11/compilers/man:$MANPATH
  4. export PATH=/home/software/apps/nvidia/hpc_sdk/23.11/Linux_x86_64/23.11/comm_libs/mpi/bin:$PATH
复制代码

353

帖子

1

威望

1973

eV
积分
2346

Level 5 (御坂)

36#
发表于 Post on 2024-2-21 14:26:52 | 只看该作者 Only view this author
hzliew 发表于 2022-11-28 14:32
楼主好,请问一下,为什么我按照您这个方法安装,在configure的时候总是退出啊?提示是:
............
s ...

参考 13楼 ./configure的参数加上
  1. F90=`which pgfortran` CC=`which pgcc` MPIF90=`which mpif90`
复制代码

202

帖子

0

威望

802

eV
积分
1004

Level 4 (黑子)

37#
发表于 Post on 2024-4-2 21:32:28 | 只看该作者 Only view this author
snljty 发表于 2021-11-2 17:59
刚编译了一下QE 6.8的GPU版本,借宝地做一下记录。
QE 6.8版本不管是GPU版本还是CPU版本都需要下载一个dev ...

checking version of nvfortran... nvfortran 24.3-0
setting F90... nvfortran
setting MPIF90... nvfortran
checking whether the compiler supports GNU C... yes
checking whether /opt/nvidia/hpc_sdk/Linux_x86_64/24.3/compilers/bin/pgcc accepts -g... yes
checking for /opt/nvidia/hpc_sdk/Linux_x86_64/24.3/compilers/bin/pgcc option to enable C11 features... none needed
setting CC... /opt/nvidia/hpc_sdk/Linux_x86_64/24.3/compilers/bin/pgcc
setting CFLAGS... -O3
using F90... nvfortran
setting FFLAGS... -fast -mp
setting F90FLAGS... -fast -Mcache_align -Mpreprocess -Mlarge_arrays -mp
setting FFLAGS_NOOPT... -O0
setting FFLAGS_NOMAIN... -Mnomain
setting CPP... cpp
setting CPPFLAGS... -P -traditional -Uvector
setting LD... nvfortran
setting LDFLAGS... -mp
checking whether Fortran compiler accepts -cuda -gpu=cuda12.4... no
configure: error: You do not have the cudafor module. Are you using NVHPC compiler?

还是出错呀,请问要怎么办?

353

帖子

1

威望

1973

eV
积分
2346

Level 5 (御坂)

38#
发表于 Post on 2024-6-4 16:20:44 | 只看该作者 Only view this author
qchem 发表于 2024-4-2 21:32
checking version of nvfortran... nvfortran 24.3-0
setting F90... nvfortran
setting MPIF90... nvf ...

在源码目录install/configure文件里搜
  1. elif test "$pgf_version" != ""
复制代码
,找到后面几行的
  1. version=`echo $pgf_version | cut -d ' ' -f2`
复制代码
一句,改成
  1. version=`echo $pgf_version | sed 's/(.*) //' | awk '{print $2}'`
复制代码
。然后记住使用的CUDA版本得是对应NvHPC支持的版本,可以尝试用NvHPC自带的CUDA环境。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-24 15:02 , Processed in 0.174888 second(s), 20 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list