VASP 用 GPU 加速后似乎没有 CPU 并行快

houziyy · 发表于 Post on 2022-12-17 20:49:53

我也来加入讨论一下。配置是AMD_epyc_7532【32 core, 128 GB内存】+ RTX3080 【10 GB显存】，系统Ubuntu22.10/窗口x11/NVIDIA-SMI 515.86.01
vasp_cpu版本：6.3.2+openmpi_4.1.4+fftw3.39+openblas0.3.20+scalapack-openmpi2.2.1，编译文件makefile.include.gnu_omp
vasp_gpu版本：6.3.2+nvhpc_22.5_(自带cuda11.7和openmpi3.1.5)+fftw3.3.8，编译文件makefile.include.nvhpc_omp

体系1：140Fe+10Si原子，普通aimd（ncore=2, ALGO=veryfast, ENCUT=400, EDIFF=1.E-4，TEBEG=300），都用的vasp_gam，分别跑30步
vasp_cpu | 20 cores | 823s
vasp_gpu | -np 1 | 1171.283s

体系2：Liquid Si - MLFF，vasp官网的机器学习文件，64Si原子 (NCORE=2), NSW=5000, 都用的vasp_gam
vasp_cpu | 6 cores | 801s
vasp_cpu | 10 cores| 436s
vasp_cpu | 20 cores| 377s
vasp_cpu | 30 cores| 335s
vasp_gpu | -np 1 | 1550s/1531/1693 （跑了三次）

总的来说，vasp_gpu版本可能在算大体系的时候会展现出优势，原子数小的时候，确实水平比cpu弱了很多。后面我再试试大体系吧，内存别爆炸就行。64atom的Si用了gpu1.2G显存吧。我再试试更大的体系。

gog · 发表于 Post on 2022-12-18 08:43:47

houziyy 发表于 2022-12-17 20:49
我也来加入讨论一下。配置是AMD_epyc_7532【32 core, 128 GB内存】+ RTX3080 【10 GB显存】，系统Ubuntu22. ...

用游戏显卡，跑经典分子动力学非常有优势。游戏卡的双精度计算核心，被砍了又砍，算第一性原理是，用的是游戏显卡的鸡肋功能。

houziyy · 发表于 Post on 2023-5-9 13:04:23

gog 发表于 2022-12-18 08:43
用游戏显卡，跑经典分子动力学非常有优势。游戏卡的双精度计算核心，被砍了又砍，算第一性原理是，用的是 ...

嗯，是的。明显的鸡肋。

ddddnight · 发表于 Post on 2024-4-21 21:50:00

请问怎么双精度跑vasp，我4090跑vasp比48和的7763CPU跑慢好多

abin · 发表于 Post on 2024-9-14 20:00:55

ddddnight 发表于 2024-4-21 21:50
请问怎么双精度跑vasp，我4090跑vasp比48和的7763CPU跑慢好多

你这句表述就有问题。

多数积分计算需要双精度，这是程序或者部分routine 自己决定的。

不是你怎么设定，就可以让程序跑在双精度模式。

一般而言，消费级的GPU，由于双精度运算性能弱，
对于严重依赖双精度积分计算的程序，
GPU能带来的加速不太明显，或者说，性价比不高。

也许，代码重构了，会有更好的表现。

ljb874722957 · 发表于 Post on 2024-11-19 11:11:35

大懒猫王浩发表于 2021-2-23 14:19
主要是现在GPU节点配备的CPU也基本上式非常好的CPU，但是一个GPU往往只用上一个CPU核心。所以单CPU节点和GP ...

你好老师，最近想用到gpu编译，是只能一个gpu用上一个cpu核心吗？不想浪费cpu多核心的算力

ljb874722957 · 发表于 Post on 2024-11-26 00:12:22

abin 发表于 2021-1-26 09:28
#SBATCH -N 1 以下申请的资源请局限在一个节点，猜测是36个核心的机器
#SBATCH -n 6 分成六组，
#SBATC ...

你好，有100纯GPU运算的吗？我发现我编译的时候cpu也占内存。

abin · 发表于 Post on 2024-11-26 09:11:33

ljb874722957 发表于 2024-11-26 00:12
你好，有100纯GPU运算的吗？我发现我编译的时候cpu也占内存。

“你好，有100纯GPU运算的吗？我发现我编译的时候cpu也占内存。”

第一句, 因为我不懂VASP, 不晓得, 无法提供. 也许咨询VASP开发者比较好.

第二句, 我没读明白, 你想说什么? 无法回复.

		自动登录 Automatic login	找回密码 Forget password
密码 Password			注册 Register

[GPU加速] VASP 用 GPU 加速后似乎没有 CPU 并行快

浏览过的版块