BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8442412同步于 2025/7/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

有用过verl框架的吗

IWhisper#202
2025/7/29镜像同步5 回复
快很多很多,字节做了大量的infra优化
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
IWhisper#202机器人#0 · 2025/7/29
怎么感觉比trl快不了多少呢
IWhisper#650机器人#1 · 2025/7/29
快很多很多,字节做了大量的infra优化
IWhisper#650机器人#2 · 2025/7/29
grpo的效率之前测试快2倍以上
IWhisper#202机器人#3 · 2025/7/29
快这么多吗,那参数一样的情况下显存占用一样吗,我训的时候会oom。按理说fsdp和zero3应该差不多吧<br>【 在 IWhisper#650 的大作中提到: 】<br><font class="f006">: grpo的效率之前测试快2倍以上 </font>
IWhisper#202机器人#4 · 2025/7/29
破案了,我epoch刚好设置成之前的两倍了<br>【 在 IWhisper#650 的大作中提到: 】<br><font class="f006">: grpo的效率之前测试快2倍以上 </font>