计算化学公社

 找回密码 Forget password
 注册 Register
Views: 5958|回复 Reply: 9
打印 Print 上一主题 Last thread 下一主题 Next thread

[CP2K] 3080ti跑CP2K加速

[复制链接 Copy URL]

39

帖子

1

威望

3976

eV
积分
4035

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 zhouoh 于 2022-8-31 16:51 编辑

最近正在学习CP2K的使用,发现对于大体系速度相比ORCA之类的快不少。CP2K虽然在手册中说只支持Tesla系列的专用卡,但我使用nvidia docker2还是成功在WSL2里面跑起来了GPU加速的CP2K 9.1.0. 顺手测试了对几个体系速度。机器配置是5900X+3080ti
安装方法:docker pull nvcr.io/hpc/cp2k:v9.1.0
运行: mpirun --bind-to none -n X binder.sh cp2k.psmp -i COF_GAPW.inp
CP2K自带的QS/H2O-128 energy 3080ti耗时136.9s,对比论坛里8273CL的40s(http://bbs.keinsci.com/thread-18029-1-1.html),可以说是惨不忍睹。
QS/H2O-64 energy 3080ti耗时58.9s,也是相较8273CL的17s慢了不少。
之后是社长博文(sobereva.com/587)里COF化合物的单点,使用B97M-rV,耗时仅为195.3s,相比于社长双路2696v3的435s居然快出了2倍有余。我猜测可能是由于这个任务使用的是对角化,而自带的H2O任务使用的是OT算法导致的。(此处有误,双路2696v3计算时间为83s,还是远快于3080ti)

计算过程中,3080ti的显存占用不大,在1-2G左右,功耗在150-200w之间浮动(TDP 350W),可见利用率是不高的。

同时测试了3080ti搭配不同CPU核心数目的测试,发现搭配四核时速度就已经达到最大,使用更多核心速度提升不大。

总而言之,游戏卡加速CP2K的性价比还是很低的,在大多数情况下都有可能起到副作用,因此并不推荐使用游戏显卡作CP2K加速使用。






评分 Rate

参与人数
Participants 1
eV +7 收起 理由
Reason
sobereva + 7

查看全部评分 View all ratings

6万

帖子

99

威望

6万

eV
积分
125127

管理员

公社社长

2#
发表于 Post on 2022-8-31 15:06:35 | 只看该作者 Only view this author
用当前机子的CPU跑和3080Ti跑的结果有没有可查觉的差别?
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

39

帖子

1

威望

3976

eV
积分
4035

Level 6 (一方通行)

3#
 楼主 Author| 发表于 Post on 2022-8-31 15:10:56 | 只看该作者 Only view this author
sobereva 发表于 2022-8-31 15:06
用当前机子的CPU跑和3080Ti跑的结果有没有可查觉的差别?

和CPU差距不大,COF化合物的单点,3080ti给的能量是-4333.31402720940332,博文里输出文件的能量是-4333.31402720893220。我猜应该是单双精度浮点混用的方案。

6万

帖子

99

威望

6万

eV
积分
125127

管理员

公社社长

4#
发表于 Post on 2022-8-31 15:11:50 | 只看该作者 Only view this author
我看了下那个COF的输出文件,当时应该是用ssmp版跑的,速度比popt版可能慢非常多,因此耗时没太大参考意义
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

39

帖子

1

威望

3976

eV
积分
4035

Level 6 (一方通行)

5#
 楼主 Author| 发表于 Post on 2022-8-31 15:17:39 | 只看该作者 Only view this author
sobereva 发表于 2022-8-31 15:11
我看了下那个COF的输出文件,当时应该是用ssmp版跑的,速度比popt版可能慢非常多,因此耗时没太大参考意义

原来如此,看来还是得用A100之类的专业卡

1245

帖子

1

威望

3860

eV
积分
5125

Level 6 (一方通行)

6#
发表于 Post on 2022-8-31 16:04:49 | 只看该作者 Only view this author
docker里面的是不是没有popt版本?

6万

帖子

99

威望

6万

eV
积分
125127

管理员

公社社长

7#
发表于 Post on 2022-8-31 16:06:38 | 只看该作者 Only view this author
还是2*2696v3机子,我刚才用目前机子里的2022.1 popt版跑,83秒算完


COF_GAPW.inp

9.88 KB, 下载次数 Times of downloads: 42

COF_GAPW.out

28.43 KB, 下载次数 Times of downloads: 20

北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

39

帖子

1

威望

3976

eV
积分
4035

Level 6 (一方通行)

8#
 楼主 Author| 发表于 Post on 2022-8-31 16:47:41 | 只看该作者 Only view this author
biogon 发表于 2022-8-31 16:04
docker里面的是不是没有popt版本?

是有popt和psmp,没有ssmp

1245

帖子

1

威望

3860

eV
积分
5125

Level 6 (一方通行)

9#
发表于 Post on 2022-8-31 17:05:10 | 只看该作者 Only view this author
zhouoh 发表于 2022-8-31 16:47
是有popt和psmp,没有ssmp

原来2022能编出来popt啊,我自己编的不知道为什么搞不出来popt

2425

帖子

1

威望

6196

eV
积分
8641

Level 6 (一方通行)

10#
发表于 Post on 2022-8-31 17:53:17 | 只看该作者 Only view this author
biogon 发表于 2022-8-31 17:05
原来2022能编出来popt啊,我自己编的不知道为什么搞不出来popt

ssmp
设定NUM_OMP_THREADS=1
ssmp 等价于sopt
官方手册讲的。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2026-2-19 10:18 , Processed in 0.188438 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list