本帖最后由 wzhang 于 2020-2-24 10:52 编辑 tomwong4253 发表于 2020-2-22 20:34 哇,终于可以跑了(虽然没有彻底解决),太感谢了! 我发现只有用CUDA_VISIBLE_DEVICES把沾满的GPU给屏蔽掉才能跑,如果单单用-gpu_id不管提交到哪个GPU都会报相同的错误。感觉这可能是GROMACS多GPU环境下的一个bug(多GPU下只要有某个GPU被占满则无法提交到所有的GPU)。。。 |
wzhang 发表于 2020-2-21 16:52 利用CUDA_VISIABLE_DEVICE环境变量或者-gpu_id参数指定某个个GPU再跑试试,有可能你的作业被扔到只剩一点显存的GPU上了,和别人一挤就炸了。 |
重启后,跑一个之前能正常跑的任务看看 |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2025-8-17 11:43 , Processed in 0.388547 second(s), 25 queries , Gzip On.