计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: szp12345
打印 Print 上一主题 Last thread 下一主题 Next thread

[配置讨论] 推荐一套适用于VASP的GPU配置

  [复制链接 Copy URL]

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

31#
 楼主 Author| 发表于 Post on 2023-2-24 09:33:23 | 只看该作者 Only view this author
zhaovic 发表于 2023-2-23 18:24
单p100用vasp6.3.2的gam版的算这个算例要130电子步才算完1个离子步。然后稍微调低encut到350避免爆显存用st ...

我觉得跟编译环境有关吧,之前KiritsuguPapa用3090测试的132步才收敛

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

32#
 楼主 Author| 发表于 Post on 2023-2-24 09:39:23 | 只看该作者 Only view this author
wolfli369 发表于 2023-2-24 09:20
能测试一下cp2k的GPU加速性能吗?

我没用过cp2k
回头搞搞试试吧

232

帖子

1

威望

3327

eV
积分
3579

Level 5 (御坂)

33#
发表于 Post on 2023-2-24 10:02:29 | 只看该作者 Only view this author
szp12345 发表于 2023-2-24 09:39
我没用过cp2k
回头搞搞试试吧

辛苦了  先谢谢

51

帖子

0

威望

2390

eV
积分
2441

Level 5 (御坂)

34#
发表于 Post on 2023-3-6 10:42:39 | 只看该作者 Only view this author
KiritsuguPapa 发表于 2023-1-4 18:39
上面3090是用nvhpc_omp_acc测的,不过OMP_NUM_THREADS=1
如果设置OMP_NUM_THREADS=4,虽然vasp输出里显 ...

我也遇到同样的问题了,请问你解决了吗,是NVIDIA HPC SDK版本的问题吗?

14

帖子

0

威望

528

eV
积分
542

Level 4 (黑子)

35#
发表于 Post on 2023-8-5 11:58:04 | 只看该作者 Only view this author
最新也想配置这样一台GPU加速度的机器,有些问题不清楚,楼主可以私聊一下吗?已发消息给您

9

帖子

0

威望

637

eV
积分
646

Level 4 (黑子)

36#
发表于 Post on 2023-9-27 11:33:29 | 只看该作者 Only view this author
CPU 7R32  gam版vasp
48核
1 T=   400. E= -.38354004E+04 F= -.38601818E+04 E0= -.38581904E+04  EK= 0.24781E+02 SP= 0.00E+00 SK= 0.00E+00
LOOP+:  cpu time    640.8056: real time    643.9117  (78电子步)

96核
1 T=   399. E= -.38354520E+04 F= -.38601818E+04 E0= -.38581908E+04  EK= 0.24730E+02 SP= 0.00E+00 SK= 0.00E+00
LOOP+:  cpu time    618.2759: real time    623.1789 81

2

帖子

0

威望

99

eV
积分
101

Level 2 能力者

37#
发表于 Post on 2023-11-6 20:27:20 | 只看该作者 Only view this author
我的vasp6 gpu,并行两张卡可以计算。但,当我并行两张以上的卡的时候,就一直卡在FFT: planning ... GRIDC!这是什么原因造成的!

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

38#
 楼主 Author| 发表于 Post on 2023-11-7 10:38:13 | 只看该作者 Only view this author
qinfei 发表于 2023-11-6 20:27
我的vasp6 gpu,并行两张卡可以计算。但,当我并行两张以上的卡的时候,就一直卡在FFT: planning ... GRIDC ...

应该是编译环境导致的,我之前用openmp+mpi编译的时候出现过这个问题

60

帖子

0

威望

702

eV
积分
762

Level 4 (黑子)

39#
发表于 Post on 2023-12-1 08:49:00 | 只看该作者 Only view this author
老师,您好,我想问下这个服务器跑deepmd怎么样。

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

40#
 楼主 Author| 发表于 Post on 2023-12-1 09:36:41 | 只看该作者 Only view this author
bblovelp 发表于 2023-12-1 08:49
老师,您好,我想问下这个服务器跑deepmd怎么样。

能跑,之前用2.1.5版本的对比过,速度是A100的1/5。
P100这个卡架构比较老,好像没有张量核心,机器学习这方面太弱。
想跑deepmd的话可以考虑V100,目前这个卡4000一张左右。

60

帖子

0

威望

702

eV
积分
762

Level 4 (黑子)

41#
发表于 Post on 2023-12-1 14:07:29 | 只看该作者 Only view this author
szp12345 发表于 2023-12-1 09:36
能跑,之前用2.1.5版本的对比过,速度是A100的1/5。
P100这个卡架构比较老,好像没有张量核心,机器学习 ...

好的,谢谢老师,最近想给服务器加显卡跑deepmd,那我看下V100

190

帖子

0

威望

867

eV
积分
1057

Level 4 (黑子)

42#
发表于 Post on 2023-12-1 14:38:48 | 只看该作者 Only view this author
szp12345 发表于 2023-12-1 09:36
能跑,之前用2.1.5版本的对比过,速度是A100的1/5。
P100这个卡架构比较老,好像没有张量核心,机器学习 ...

兄弟,v100和2080ti,跑deepmd的话推荐哪个

67

帖子

0

威望

1085

eV
积分
1152

Level 4 (黑子)

43#
 楼主 Author| 发表于 Post on 2023-12-1 18:49:50 | 只看该作者 Only view this author
Picardo 发表于 2023-12-1 14:38
兄弟,v100和2080ti,跑deepmd的话推荐哪个

没有对比过这两个卡,我对比过p100和2080s,p100稍微快一点,20系列的架构是要比p100新的。
另外显存也比较重要,尽量选大的。
资金充足可以考虑32g的v100,捡垃圾的话11g的2080ti不用考虑,22g的2080ti和16g的v100之间我也不知道该选哪个……

190

帖子

0

威望

867

eV
积分
1057

Level 4 (黑子)

44#
发表于 Post on 2023-12-3 09:58:03 | 只看该作者 Only view this author
szp12345 发表于 2023-12-1 18:49
没有对比过这两个卡,我对比过p100和2080s,p100稍微快一点,20系列的架构是要比p100新的。
另外显存也 ...

谢谢兄弟,最近入一个,之前想买3090,报销什么的一懒,涨了3000。赶快入一个,估计这些也得涨

8

帖子

0

威望

626

eV
积分
634

Level 4 (黑子)

45#
发表于 Post on 2023-12-20 11:02:42 | 只看该作者 Only view this author
双卡跑vasp纯泛函和杂化泛函,加速情况怎么样,显存会爆吗?

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 03:04 , Processed in 0.234116 second(s), 22 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list