返回信息流问题是普通实验室训个7B的都不一定训得起来<img src="/img/ubb/ema/2.gif" alt="ema2" style="display:inline;border-style:none">
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8470129同步于 2025/8/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
agent rl现在好火
IWhisper#957
2025/8/20镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
问题是普通实验室训个7B的都不一定训得起来<img src="/img/ubb/ema/2.gif" alt="ema2" style="display:inline;border-style:none">
准备点找实习?<br>【 在 IWhisper#438 的大作中提到: 】<br><font class="f006">: 问题是普通实验室训个7B的都不一定训得起来<img src="/img/ubb/ema/2.gif" alt="ema2" style="display:inline;border-style:none"> </font>
感觉至少得把LLM RL的跑几个,知道Agent相比LLM怎么做RL的<br>【 在 IWhisper#957 的大作中提到: 】<br><font class="f006">: 准备点找实习? </font>