计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1428|回复 Reply: 24

[配置讨论] 推荐一套适用于VASP的GPU配置

[复制链接 Copy URL]

34

帖子

0

威望

564

eV
积分
598

Level 4 (黑子)

发表于 Post on 2022-12-22 22:04:44 | 显示全部楼层 Show all |阅读模式 Reading model
本帖最后由 szp12345 于 2023-1-3 11:11 编辑

本人手里有两张RTX2080S显卡,尝试使用GPU版VASP,发现GPU加速效果硬实很好。但是2080S只有8G显存,计算较大的体系时经常爆显存,官网建议使用P100、V100、A100等计算卡,在某宝上调研P100价格很好,入手了两张,当时价格为2100一张,对比2080S速度提升非常明显,测试结果如下:

测试结果对比

测试结果对比

CPU计算速度

CPU计算速度

2080S计算速度

2080S计算速度

P100计算速度

P100计算速度


趁最近显卡降价又购置了一套GPU机器,具体配置及价格如下:

CPU:2696V3 *2                   470*2  (某宝)
内存:镁光2133 16G*8          148*8  (某宝)
主板机箱电源:超微7048GR    3500   (某鱼)
计算卡:TESLA P100              1500*4(某宝)
硬盘:500G机械,闲置硬盘
总价11624,不含税

由于最近快递瘫痪,买的东西迟迟未到,新机器测试结果等后续再补发。
另由于本人是做实验出身的,计算只是略懂皮毛,测试对比可能有不准确之处,仅供参考。

KiritsuguPapa之邀,分享测试文件和vasp编译文件
input-makefile.rar (451.79 KB, 下载次数 Times of downloads: 18)

评分 Rate

参与人数
Participants 4
eV +21 收起 理由
Reason
anson + 3 谢谢分享
sobereva + 8
卡开发发 + 5 欢迎讨论
Picardo + 5 谢谢

查看全部评分 View all ratings

34

帖子

0

威望

564

eV
积分
598

Level 4 (黑子)

 楼主 Author| 发表于 Post on 2022-12-22 22:06:05 | 显示全部楼层 Show all
本帖最后由 szp12345 于 2022-12-25 20:15 编辑

补发四卡测试结果,计算速度提升明显,比双卡快了一倍,约6秒一个电子步。

4卡P100测试结果

4卡P100测试结果




顺便说一下其它问题:
1,P100的双精度为2080S的10倍左右,但实际计算速度P100是2080S的2倍,有没有大佬知道什么原因?
2,P100计算时使用率最高90%左右,2080S则100%,是否CPU瓶颈?

95

帖子

0

威望

423

eV
积分
518

Level 4 (黑子)

发表于 Post on 2022-12-22 22:13:41 | 显示全部楼层 Show all
楼主也测下cpu计算时间呗

34

帖子

0

威望

564

eV
积分
598

Level 4 (黑子)

 楼主 Author| 发表于 Post on 2022-12-22 23:15:52 | 显示全部楼层 Show all
Picardo 发表于 2022-12-22 22:13
楼主也测下cpu计算时间呗

上面测试结果里面有,双路2696V3共36核,每电子步平均时间40秒

95

帖子

0

威望

423

eV
积分
518

Level 4 (黑子)

发表于 Post on 2022-12-23 09:23:55 | 显示全部楼层 Show all
本帖最后由 Picardo 于 2022-12-23 09:28 编辑
szp12345 发表于 2022-12-22 23:15
上面测试结果里面有,双路2696V3共36核,每电子步平均时间40秒

好的,羊了之后,眼神有点问题,抱歉。请教一下,vasp算aimd的时候主要用单精度嘛

34

帖子

0

威望

564

eV
积分
598

Level 4 (黑子)

 楼主 Author| 发表于 Post on 2022-12-23 17:23:10 | 显示全部楼层 Show all
Picardo 发表于 2022-12-23 09:23
好的,羊了之后,眼神有点问题,抱歉。请教一下,vasp算aimd的时候主要用单精度嘛

双精度,2080S的单精度比P100的强,但还是P100计算速度快

1852

帖子

1

威望

4098

eV
积分
5970

Level 6 (一方通行)

发表于 Post on 2022-12-23 19:03:27 | 显示全部楼层 Show all
楼主, 用简单的测试数据,
再次论证了,
对于VASP等依赖双精度的计算任务,
使用专业卡,效果当然不错了。

这玩意不是跑MD,消费级的GPU是没啥用处的。

新卡当然很贵了, 不过可以试试万能的某宝某鱼呀。
反正都是拆机旧货,能用就行呗。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
App,  https://gitee.com/hpc4you/linux
hpc4you toolkit,  https://gitee.com/hpc4you/hpc
电邮hpc4you@163.com VX: hpc4you

154

帖子

0

威望

2225

eV
积分
2379

Level 5 (御坂)

发表于 Post on 2022-12-25 10:15:53 | 显示全部楼层 Show all
VASP不能跨卡分配显存,32G的黄卡超过2万块一张,不知啥时候能再腰折一次!

34

帖子

0

威望

564

eV
积分
598

Level 4 (黑子)

 楼主 Author| 发表于 Post on 2022-12-25 20:09:19 | 显示全部楼层 Show all
ghifi37 发表于 2022-12-25 10:15
VASP不能跨卡分配显存,32G的黄卡超过2万块一张,不知啥时候能再腰折一次!

等吧,目前16G显存基本够用。
不过,腰折一次还是买不起,得好几次...

34

帖子

0

威望

564

eV
积分
598

Level 4 (黑子)

 楼主 Author| 发表于 Post on 2022-12-25 20:19:48 | 显示全部楼层 Show all
abin 发表于 2022-12-23 19:03
楼主, 用简单的测试数据,
再次论证了,
对于VASP等依赖双精度的计算任务,

确实,通用就行。另外,捡垃圾使我快乐

137

帖子

1

威望

1366

eV
积分
1523

Level 5 (御坂)

发表于 Post on 2023-1-1 18:32:26 | 显示全部楼层 Show all
能否分享一下任务文件和编译参数?

34

帖子

0

威望

564

eV
积分
598

Level 4 (黑子)

 楼主 Author| 发表于 Post on 2023-1-3 11:12:18 | 显示全部楼层 Show all
KiritsuguPapa 发表于 2023-1-1 18:32
能否分享一下任务文件和编译参数?

已上传贴子附件,欢迎一同探讨

137

帖子

1

威望

1366

eV
积分
1523

Level 5 (御坂)

发表于 Post on 2023-1-3 11:37:02 | 显示全部楼层 Show all
szp12345 发表于 2023-1-3 11:12
已上传贴子附件,欢迎一同探讨

谢谢 我也测试一下

137

帖子

1

威望

1366

eV
积分
1523

Level 5 (御坂)

发表于 Post on 2023-1-3 16:55:02 | 显示全部楼层 Show all
本帖最后由 KiritsuguPapa 于 2023-1-3 17:39 编辑

用纯CPU、64核8336C跑的结果:

$ grep -m 1 F= OSZICAR
      1 T=   400. E= -.38353970E+04 F= -.38601816E+04 E0= -.38581903E+04  EK= 0.24785E+02 SP= 0.00E+00 SK= 0.00E+00
$ grep -m 1 LOOP+ OUTCAR
     LOOP+:  cpu time    746.1045: real time    751.6612(共81个电子步)

麻烦楼主对比看看第一步离子步的时间?以及能量值是否相近?因为CPU和GPU算法不同,电子步时间不一定能直接比较。
上面测试是用vasp_gam跑的,记得用OpenACC应该也能用vasp_gam来着?
稍后我再测一下3090和tesla T4的情况发上来

137

帖子

1

威望

1366

eV
积分
1523

Level 5 (御坂)

发表于 Post on 2023-1-3 17:39:32 | 显示全部楼层 Show all
52核8272CL的结果:

$ grep -m 1 F= OSZICAR
      1 T=   400. E= -.38354115E+04 F= -.38601818E+04 E0= -.38581908E+04  EK= 0.24770E+02 SP= 0.00E+00 SK= 0.00E+00
$ grep -m 1 LOOP+ OUTCAR
     LOOP+:  cpu time   1149.2981: real time   1162.3467(共77个电子步)

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2023-2-2 22:01 , Processed in 0.762676 second(s), 26 queries .

快速回复 返回顶部 返回列表 Return to list