返回信息流灵感来源于mentor让我用强化学习训练一个大模型很不删除的功能,我都害怕大模型没有sft教,会不知道怎么写
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8420958同步于 2025/7/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
感觉自己实习像强化学习而不是sft
IWhisper#563
2025/7/14镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
没有人告诉我应该怎么做,只能自己瞎做,然后遇到问题以后不断学习,不断试错,渐渐适应新的工作内容<img src="/img/ubb/ema/12.gif" alt="ema12" style="display:inline;border-style:none">
大模型很不擅长<br>【 在 IWhisper#563 的大作中提到: 】<br><font class="f006">: 灵感来源于mentor让我用强化学习训练一个大模型很不删除的功能,我都害怕大模型没有sft教,会不知道怎么写 </font><br>
别瞎教了<br>【 在 IWhisper#261 的大作中提到: 】<br><font class="f006">: 强化学习的目的是学出来格式。并不是能力 </font>