计算化学公社

标题: 求助VASP是否编译GPU版本问题 [打印本页]

作者
Author:
WVzzz    时间: 2023-2-19 11:35
标题: 求助VASP是否编译GPU版本问题
本帖最后由 WVzzz 于 2023-2-19 11:46 编辑

服务器电脑要重装系统,重装VASP,求教各位老师几个问题。1.服务器共80核,256G内存,一块P100显卡,之前CPU版本用NCORE=1内存会爆掉,我看GPU版本必须NCORE=1,所以可不可以运行?
2.GPU版本编译后,CPU版本是不是集合在里面的?如果集合在里面直接可以单用,编译试试也无妨
3.VASP版本对GPU版本运行有没有影响,目前有手头有5.4.4和6.3.0两个版本,对效率影响大吗?



作者
Author:
876449830    时间: 2023-2-19 12:47
我们组的机器是64核,256G,A2000的卡;vasp6.3.0两个版本独立编译的,GPU版本要装cuda。你内存爆掉可能是Intel编译器有问题,GPU版本运行好像没有影响。供参考。
作者
Author:
WVzzz    时间: 2023-2-19 13:01
本帖最后由 WVzzz 于 2023-2-19 15:51 编辑
876449830 发表于 2023-2-19 12:47
我们组的机器是64核,256G,A2000的卡;vasp6.3.0两个版本独立编译的,GPU版本要装cuda。你内存爆掉可能是I ...

只CPU运算时NCORE=8,内存占用才一点大约20%吧,方便说一下,您现在集群LINUX版本和编译方法嘛,多谢,因为现在多是5.4的
作者
Author:
876449830    时间: 2023-2-19 19:38
WVzzz 发表于 2023-2-19 13:01
只CPU运算时NCORE=8,内存占用才一点大约20%吧,方便说一下,您现在集群LINUX版本和编译方法嘛,多谢,因 ...

centos79,Intel2020
作者
Author:
WVzzz    时间: 2023-2-19 21:54
876449830 发表于 2023-2-19 19:38
centos79,Intel2020

也就是inter2020和acc各编各的是吧,还有GPU编译的具体方法是?两种适应什么情况使用,小白不是很懂,多谢
作者
Author:
Aletyx    时间: 2023-2-20 03:29
1. GPU版本主要吃显存,显存不足肯定会炸。
2. GPU版本里面不包含CPU版本。编译出来是直接跑在GPU上的。
3. 有影响。5.4.4版本还是用的老版本的加速,6.3已经换成新的openACC了,效率应该更高一点。
作者
Author:
876449830    时间: 2023-2-20 08:24
WVzzz 发表于 2023-2-19 21:54
也就是inter2020和acc各编各的是吧,还有GPU编译的具体方法是?两种适应什么情况使用,小白不是很懂, ...

GPU编译要先装cuda驱动,然后正常编译GPU版本
作者
Author:
WVzzz    时间: 2023-2-20 08:51
876449830 发表于 2023-2-20 08:24
GPU编译要先装cuda驱动,然后正常编译GPU版本

收到
作者
Author:
WVzzz    时间: 2023-2-20 08:55
Aletyx 发表于 2023-2-20 03:29
1. GPU版本主要吃显存,显存不足肯定会炸。
2. GPU版本里面不包含CPU版本。编译出来是直接跑在GPU上的。
...

那下载GPU版本意义大不大,一个GPU对应一个进程,也就是一个核,剩下的都是NCORE=1在跑,我看官网确实说NCORE=1会导致内存的大幅度上升,就算效率高是不是也跑不了
作者
Author:
Aletyx    时间: 2023-2-20 14:10
WVzzz 发表于 2023-2-20 08:55
那下载GPU版本意义大不大,一个GPU对应一个进程,也就是一个核,剩下的都是NCORE=1在跑,我看官网确实说N ...

1. 显卡加速还是比较香的
2. 目前因为NCCL的限制,1张卡只能跑1个进程,不像CPU版本可以跑很多进程。同时,GPU版本默认一个显卡搭配1个CPU核心,所以基本不怎么占内存,而是很消耗显存。有什么办法能够使用一个GPU,同时搭配多个CPU核心呢:可以考虑编译mkl+openmp的GPU加速版本,然后设置OMP_NUM_THREADS
3.CPU和GPU硬件架构就有根本区别。虽然GPU只能跑1个线程,但是显卡里面本身就是高度并行化的,有很多“小核心”会同时计算,所以效率高。
作者
Author:
zhaovic    时间: 2023-2-20 15:19
gpu版本的话小体系加速不明显,大体系加速效果相当好,不过p100只有16g显存也算不了太大体系。
gpu计算和cpu计算是分开的,建议是cpu版和gpu版都编译一下,充分利用计算资源。6.3版本的gpu改用了openacc编译,效果比原来的cuda编译强的多,不过编译也难一些,多找找教程吧,编译出来的可执行文件也是vasp_std那些不过是直接用gpu计算的,记得改名字。
vasp6.3的机器学习力场也是个好东西,不过这个我也还在摸索。
作者
Author:
WVzzz    时间: 2023-2-20 17:43
Aletyx 发表于 2023-2-20 14:10
1. 显卡加速还是比较香的
2. 目前因为NCCL的限制,1张卡只能跑1个进程,不像CPU版本可以跑很多进程。同 ...

关于第二点我也看了,不过官网说一显卡最多搭配2-4个好像,还会性能降低,得不偿失,感觉必要性不大
作者
Author:
WVzzz    时间: 2023-2-20 20:45
zhaovic 发表于 2023-2-20 15:19
gpu版本的话小体系加速不明显,大体系加速效果相当好,不过p100只有16g显存也算不了太大体系。
gpu计算和c ...

我试试,多谢




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3