计算化学公社

 找回密码 Forget password
 注册 Register

gmx突然报错cudaFuncGetAttributes failed: out of memory

查看数: 11105 | 评论数: 4 | 收藏 Add to favorites 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2020-2-20 10:36

正文摘要:

大家好,我在GPU版本GROMACS上跑程序一直没有问题,今天重新运行一个程序之后,突然报错如下: Command line:   gmx mdrun -deffnm pull -ntmpi 1 -nb gpu -pme gpu -gpu_id 3 Back Off! I just ...

回复 Reply

wzhang 发表于 Post on 2020-2-23 14:10:09
本帖最后由 wzhang 于 2020-2-24 10:52 编辑
tomwong4253 发表于 2020-2-22 20:34
利用CUDA_VISIABLE_DEVICE环境变量或者-gpu_id参数指定某个个GPU再跑试试,有可能你的作业被扔到只剩一点 ...

哇,终于可以跑了(虽然没有彻底解决),太感谢了!
我发现只有用CUDA_VISIBLE_DEVICES把沾满的GPU给屏蔽掉才能跑,如果单单用-gpu_id不管提交到哪个GPU都会报相同的错误。感觉这可能是GROMACS多GPU环境下的一个bug(多GPU下只要有某个GPU被占满则无法提交到所有的GPU)。。。
tomwong4253 发表于 Post on 2020-2-22 20:34:21
wzhang 发表于 2020-2-21 16:52
这个server我可能没有权限重启。我试了重新安装gromacs也还是相同的问题,不知道是不是其他用户在算pytho ...

利用CUDA_VISIABLE_DEVICE环境变量或者-gpu_id参数指定某个个GPU再跑试试,有可能你的作业被扔到只剩一点显存的GPU上了,和别人一挤就炸了。
sobereva 发表于 Post on 2020-2-21 16:36:39
重启后,跑一个之前能正常跑的任务看看

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-17 11:43 , Processed in 0.388547 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list