本帖最后由 abin 于 2024-5-21 16:17 编辑 另外, 请查阅硬件配置. 4个GPU, 有两个在第一颗处理器上; 另外两个GPU在第二颗处理器上. 你可能需要手动指定GPU和cpu_core之间的绑定; 或者修改slurm配置, 指定GPU和cpu_core之间的绑定关系. 另外, 如果你的主板, 还接驳有其他的PCIe设备, 这个机器的PCIe通道, 可能数量不足呢. |
gaozx 发表于 2024-5-21 15:58 你又没有手动指定处理器, 凭啥自动分派? |
abin 发表于 2024-5-21 15:51 感谢回复!不通过slurm作业系统提交,直接mpirun也存在同样的问题。 ![]() |
修改 gres.conf 具体看slurm手册. |
手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图
GMT+8, 2025-8-13 00:22 , Processed in 0.412422 second(s), 25 queries , Gzip On.