计算化学公社

 找回密码 Forget password
 注册 Register
Views: 1614|回复 Reply: 5
打印 Print 上一主题 Last thread 下一主题 Next thread

[GPU加速] VASP6.4.1 GPU版本遇到的real time 是cpu time的二倍问题

[复制链接 Copy URL]

14

帖子

0

威望

486

eV
积分
500

Level 4 (黑子)

本帖最后由 weitao 于 2023-7-6 16:37 编辑

使用A100-80G 做VASP6.4.1的GPU加速,经常会遇到real time是cpu time的二倍,百思不得其解,尚未找到能修正这个问题的解决方式。
grep LOOP OUTCAR
      LOOP:  cpu time     12.4413: real time     24.8912
      LOOP:  cpu time     11.7627: real time     23.5531
      LOOP:  cpu time     11.7497: real time     23.5035
      LOOP:  cpu time     12.5075: real time     25.0248
      LOOP:  cpu time     14.9064: real time     29.8451
      LOOP:  cpu time     16.9084: real time     33.8327
      LOOP:  cpu time     16.7066: real time     33.4186
makefile.include INCAR和提交脚本如附件所示


makefile.include

3.59 KB, 下载次数 Times of downloads: 24

INCAR

569 Bytes, 下载次数 Times of downloads: 6

log.txt

1.11 KB, 下载次数 Times of downloads: 2

OUTCAR

88 KB, 下载次数 Times of downloads: 1

vasp_GPU.sh

865 Bytes, 下载次数 Times of downloads: 15

1060

帖子

0

威望

3254

eV
积分
4314

Level 6 (一方通行)

2#
发表于 Post on 2023-7-6 22:11:30 | 只看该作者 Only view this author
我遇到的问题更诡异,GPU 版的 VASP 跑了几步电子步之后 GPU 开始摸鱼,负载就降到 0 。然后就切换到 CPU 上运行。

由于节点上只有一张 A100 40GB 的GPU,作业脚本里只能设置 #SBATCH --ntasks-per-node=1,也就是只有一个 CPU 接着运行,导致每个电子步从 GPU 的 15 s 的耗时超过 10000 秒……

1

帖子

0

威望

71

eV
积分
72

Level 2 能力者

3#
发表于 Post on 2023-7-9 22:04:08 | 只看该作者 Only view this author
集群的硬盘配置是怎么样的啊,会不会是IO的问题。

4

帖子

0

威望

21

eV
积分
25

Level 2 能力者

4#
发表于 Post on 2023-10-27 14:27:22 | 只看该作者 Only view this author
你的主板是不是可以插多张GPU卡,比如是8卡或者10卡的主板?那么每颗CPU下面会连一颗icswitch芯片,然后每个icSwitch芯片会连4个或者5个pcie设备,这种cpu gpu非直连架构的机器跑vasp这种高内存显存访问频率的程序会非常拉胯。

2

帖子

0

威望

91

eV
积分
93

Level 2 能力者

5#
发表于 Post on 2023-12-24 20:04:12 | 只看该作者 Only view this author
我也遇到了这个问题,换了数学库什么的都没有效果。而且所有时间乘2实在是太诡异了。。楼主解决了吗

2

帖子

0

威望

91

eV
积分
93

Level 2 能力者

6#
发表于 Post on 2023-12-27 09:46:42 | 只看该作者 Only view this author
qty 发表于 2023-12-24 20:04
我也遇到了这个问题,换了数学库什么的都没有效果。而且所有时间乘2实在是太诡异了。。楼主解决了吗

我解决了,把显卡查到最上面那个槽就好了

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 15:29 , Processed in 1.815157 second(s), 30 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list