返回信息流快很多很多,字节做了大量的infra优化
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8442412同步于 2025/7/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
有用过verl框架的吗
IWhisper#202
2025/7/29镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
快这么多吗,那参数一样的情况下显存占用一样吗,我训的时候会oom。按理说fsdp和zero3应该差不多吧<br>【 在 IWhisper#650 的大作中提到: 】<br><font class="f006">: grpo的效率之前测试快2倍以上 </font>
破案了,我epoch刚好设置成之前的两倍了<br>【 在 IWhisper#650 的大作中提到: 】<br><font class="f006">: grpo的效率之前测试快2倍以上 </font>