计算化学公社

标题: VASP6.4.1 GPU版本遇到的real time 是cpu time的二倍问题 [打印本页]

作者
Author:
weitao    时间: 2023-7-6 16:30
标题: VASP6.4.1 GPU版本遇到的real time 是cpu time的二倍问题
本帖最后由 weitao 于 2023-7-6 16:37 编辑

使用A100-80G 做VASP6.4.1的GPU加速,经常会遇到real time是cpu time的二倍,百思不得其解,尚未找到能修正这个问题的解决方式。
grep LOOP OUTCAR
      LOOP:  cpu time     12.4413: real time     24.8912
      LOOP:  cpu time     11.7627: real time     23.5531
      LOOP:  cpu time     11.7497: real time     23.5035
      LOOP:  cpu time     12.5075: real time     25.0248
      LOOP:  cpu time     14.9064: real time     29.8451
      LOOP:  cpu time     16.9084: real time     33.8327
      LOOP:  cpu time     16.7066: real time     33.4186
makefile.include INCAR和提交脚本如附件所示



作者
Author:
乐平    时间: 2023-7-6 22:11
我遇到的问题更诡异,GPU 版的 VASP 跑了几步电子步之后 GPU 开始摸鱼,负载就降到 0 。然后就切换到 CPU 上运行。

由于节点上只有一张 A100 40GB 的GPU,作业脚本里只能设置 #SBATCH --ntasks-per-node=1,也就是只有一个 CPU 接着运行,导致每个电子步从 GPU 的 15 s 的耗时超过 10000 秒……
作者
Author:
johnnywow    时间: 2023-7-9 22:04
集群的硬盘配置是怎么样的啊,会不会是IO的问题。
作者
Author:
不能左右    时间: 2023-10-27 14:27
你的主板是不是可以插多张GPU卡,比如是8卡或者10卡的主板?那么每颗CPU下面会连一颗icswitch芯片,然后每个icSwitch芯片会连4个或者5个pcie设备,这种cpu gpu非直连架构的机器跑vasp这种高内存显存访问频率的程序会非常拉胯。
作者
Author:
qty    时间: 2023-12-24 20:04
我也遇到了这个问题,换了数学库什么的都没有效果。而且所有时间乘2实在是太诡异了。。楼主解决了吗
作者
Author:
qty    时间: 2023-12-27 09:46
qty 发表于 2023-12-24 20:04
我也遇到了这个问题,换了数学库什么的都没有效果。而且所有时间乘2实在是太诡异了。。楼主解决了吗

我解决了,把显卡查到最上面那个槽就好了




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3