计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: Ionizing
打印 Print 上一主题 Last thread 下一主题 Next thread

[GPU加速] VASP 用 GPU 加速后似乎没有 CPU 并行快

[复制链接 Copy URL]

6

帖子

0

威望

39

eV
积分
45

Level 2 能力者

16#
发表于 Post on 2022-12-17 20:49:53 | 只看该作者 Only view this author
我也来加入讨论一下。配置是AMD_epyc_7532【32 core, 128 GB内存】+ RTX3080 【10 GB显存】,系统Ubuntu22.10/窗口x11/NVIDIA-SMI 515.86.01
vasp_cpu版本:6.3.2+openmpi_4.1.4+fftw3.39+openblas0.3.20+scalapack-openmpi2.2.1,编译文件makefile.include.gnu_omp
vasp_gpu版本:6.3.2+nvhpc_22.5_(自带cuda11.7和openmpi3.1.5)+fftw3.3.8,编译文件makefile.include.nvhpc_omp

体系1:140Fe+10Si原子,普通aimd(ncore=2, ALGO=veryfast, ENCUT=400, EDIFF=1.E-4,TEBEG=300),都用的vasp_gam,分别跑30步
vasp_cpu | 20 cores | 823s
vasp_gpu | -np 1     | 1171.283s

体系2:Liquid Si - MLFF,vasp官网的机器学习文件,64Si原子 (NCORE=2), NSW=5000, 都用的vasp_gam
vasp_cpu | 6 cores | 801s
vasp_cpu | 10 cores| 436s
vasp_cpu | 20 cores| 377s
vasp_cpu | 30 cores| 335s
vasp_gpu | -np 1    | 1550s/1531/1693 (跑了三次)

总的来说,vasp_gpu版本可能在算大体系的时候会展现出优势,原子数小的时候,确实水平比cpu弱了很多。后面我再试试大体系吧,内存别爆炸就行。64atom的Si用了gpu1.2G显存吧。我再试试更大的体系。

328

帖子

0

威望

1916

eV
积分
2244

Level 5 (御坂)

17#
发表于 Post on 2022-12-18 08:43:47 | 只看该作者 Only view this author
houziyy 发表于 2022-12-17 20:49
我也来加入讨论一下。配置是AMD_epyc_7532【32 core, 128 GB内存】+ RTX3080 【10 GB显存】,系统Ubuntu22. ...

用游戏显卡,跑经典分子动力学非常有优势。游戏卡的双精度计算核心,被砍了又砍,算第一性原理是,用的是游戏显卡的鸡肋功能。

6

帖子

0

威望

39

eV
积分
45

Level 2 能力者

18#
发表于 Post on 2023-5-9 13:04:23 | 只看该作者 Only view this author
gog 发表于 2022-12-18 08:43
用游戏显卡,跑经典分子动力学非常有优势。游戏卡的双精度计算核心,被砍了又砍,算第一性原理是,用的是 ...

嗯,是的。明显的鸡肋。

215

帖子

0

威望

1097

eV
积分
1312

Level 4 (黑子)

19#
发表于 Post on 2024-4-21 21:50:00 | 只看该作者 Only view this author
请问怎么双精度跑vasp,我4090跑vasp比48和的7763CPU跑慢好多

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

20#
发表于 Post on 2024-9-14 20:00:55 | 只看该作者 Only view this author
ddddnight 发表于 2024-4-21 21:50
请问怎么双精度跑vasp,我4090跑vasp比48和的7763CPU跑慢好多

你这句表述就有问题。

多数积分计算需要双精度,这是程序或者部分routine 自己决定的。

不是你怎么设定,就可以让程序跑在双精度模式。

一般而言,消费级的GPU,由于双精度运算性能弱,
对于严重依赖双精度积分计算的程序,
GPU能带来的加速不太明显,或者说,性价比不高。

也许,代码重构了,会有更好的表现。

High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

29

帖子

0

威望

113

eV
积分
142

Level 2 能力者

21#
发表于 Post on 4 day ago | 只看该作者 Only view this author
大懒猫王浩 发表于 2021-2-23 14:19
主要是现在GPU节点配备的CPU也基本上式非常好的CPU,但是一个GPU往往只用上一个CPU核心。所以单CPU节点和GP ...

你好老师,最近想用到gpu编译,是只能一个gpu用上一个cpu核心吗?不想浪费cpu多核心的算力

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 08:22 , Processed in 0.173982 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list