返回信息流我也是,甚至3080和组里的a100性能都相差无几[em11]
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #6881006同步于 2024/3/2
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
模型训练太慢求教
IWhisper#111
2024/3/2镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
10 条回复
rt,lz在组里的工作站上训练模型,3090的卡跑一个epoch花的时间大概半分钟。租了autodl上的4090,发现训练一个epoch的时间差不多[em21]。
看CPU和GPU的利用率发现,4090上的CPU利用率一直顶着限制,GPU的利用率波动很大。3090上的CPU和GPU都很稳定,CPU核数确实比4090的多,这种情况要咋搞呢,求教[em6]
或者是我的代码写的不好,有什么调优策略吗[em22]