计算化学公社

 找回密码 Forget password
 注册 Register
Views: 948|回复 Reply: 2
打印 Print 上一主题 Last thread 下一主题 Next thread

[其它程序] deepmd训练模型GPU利用率低是什么原因

[复制链接 Copy URL]

36

帖子

0

威望

753

eV
积分
789

Level 4 (黑子)

跳转到指定楼层 Go to specific reply
楼主
本帖最后由 orangesea 于 2024-8-24 19:39 编辑

在服务器上训练网上下载的一个算例,分别使用一张1080Ti、一张4090、两张4090训练4000步作为测试,可以正常训练,但耗时都在100秒左右。
使用一张4090占用率只有30%左右
使用两张时只有一张有30%占用率,另一张被分配了任务但是占用率很低
请问GPU利用率低是什么原因?为什么1080Ti、4090耗时差不多?
运行命令
  1. export CUDA_VISIBLE_DEVICES=0   #这里分别设置了一张1080Ti、一张4090、两张4090作为测试
  2. nohup dp train input.json > run.out &
复制代码
input.json和三个输出文件上传在附件中


2024.8.24更新
算例原先通过E5 2680v4@4090计算,通过AutoDl的EPYC 9654@4090计算可从原来90多秒提升到50多秒,应该是2680v4的单核性能瓶颈导致的


test.zip

12.4 KB, 阅读权限: 10, 下载次数 Times of downloads: 5

7

帖子

0

威望

103

eV
积分
110

Level 2 能力者

2#
发表于 Post on 2025-1-9 01:29:11 | 只看该作者 Only view this author
我最近也在搞这个问题,请问
我用的epyc9654+4090的速度没有我自己笔记本4060的快,也是因为单核频率的限制么

7

帖子

0

威望

103

eV
积分
110

Level 2 能力者

3#
发表于 Post on 2025-1-9 01:31:57 | 只看该作者 Only view this author
补充一下我的4090gpu占用率太低了,我并没有有效的手段提高能指点一下么

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-18 04:25 , Processed in 0.483324 second(s), 23 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list