计算化学公社

标题: 3080ti跑CP2K加速 [打印本页]

作者
Author:
zhouoh    时间: 2022-8-31 14:51
标题: 3080ti跑CP2K加速
本帖最后由 zhouoh 于 2022-8-31 16:51 编辑

最近正在学习CP2K的使用,发现对于大体系速度相比ORCA之类的快不少。CP2K虽然在手册中说只支持Tesla系列的专用卡,但我使用nvidia docker2还是成功在WSL2里面跑起来了GPU加速的CP2K 9.1.0. 顺手测试了对几个体系速度。机器配置是5900X+3080ti
安装方法:docker pull nvcr.io/hpc/cp2k:v9.1.0
运行: mpirun --bind-to none -n X binder.sh cp2k.psmp -i COF_GAPW.inp
CP2K自带的QS/H2O-128 energy 3080ti耗时136.9s,对比论坛里8273CL的40s(http://bbs.keinsci.com/thread-18029-1-1.html),可以说是惨不忍睹。
QS/H2O-64 energy 3080ti耗时58.9s,也是相较8273CL的17s慢了不少。
之后是社长博文(sobereva.com/587)里COF化合物的单点,使用B97M-rV,耗时仅为195.3s,相比于社长双路2696v3的435s居然快出了2倍有余。我猜测可能是由于这个任务使用的是对角化,而自带的H2O任务使用的是OT算法导致的。(此处有误,双路2696v3计算时间为83s,还是远快于3080ti)

计算过程中,3080ti的显存占用不大,在1-2G左右,功耗在150-200w之间浮动(TDP 350W),可见利用率是不高的。

同时测试了3080ti搭配不同CPU核心数目的测试,发现搭配四核时速度就已经达到最大,使用更多核心速度提升不大。

总而言之,游戏卡加速CP2K的性价比还是很低的,在大多数情况下都有可能起到副作用,因此并不推荐使用游戏显卡作CP2K加速使用。







作者
Author:
sobereva    时间: 2022-8-31 15:06
用当前机子的CPU跑和3080Ti跑的结果有没有可查觉的差别?
作者
Author:
zhouoh    时间: 2022-8-31 15:10
sobereva 发表于 2022-8-31 15:06
用当前机子的CPU跑和3080Ti跑的结果有没有可查觉的差别?

和CPU差距不大,COF化合物的单点,3080ti给的能量是-4333.31402720940332,博文里输出文件的能量是-4333.31402720893220。我猜应该是单双精度浮点混用的方案。
作者
Author:
sobereva    时间: 2022-8-31 15:11
我看了下那个COF的输出文件,当时应该是用ssmp版跑的,速度比popt版可能慢非常多,因此耗时没太大参考意义
作者
Author:
zhouoh    时间: 2022-8-31 15:17
sobereva 发表于 2022-8-31 15:11
我看了下那个COF的输出文件,当时应该是用ssmp版跑的,速度比popt版可能慢非常多,因此耗时没太大参考意义

原来如此,看来还是得用A100之类的专业卡
作者
Author:
biogon    时间: 2022-8-31 16:04
docker里面的是不是没有popt版本?
作者
Author:
sobereva    时间: 2022-8-31 16:06
还是2*2696v3机子,我刚才用目前机子里的2022.1 popt版跑,83秒算完



作者
Author:
zhouoh    时间: 2022-8-31 16:47
biogon 发表于 2022-8-31 16:04
docker里面的是不是没有popt版本?

是有popt和psmp,没有ssmp
作者
Author:
biogon    时间: 2022-8-31 17:05
zhouoh 发表于 2022-8-31 16:47
是有popt和psmp,没有ssmp

原来2022能编出来popt啊,我自己编的不知道为什么搞不出来popt

作者
Author:
abin    时间: 2022-8-31 17:53
biogon 发表于 2022-8-31 17:05
原来2022能编出来popt啊,我自己编的不知道为什么搞不出来popt

ssmp
设定NUM_OMP_THREADS=1
ssmp 等价于sopt
官方手册讲的。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3