返回信息流llm的强化学习还是传统强化学习
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8776084同步于 2026/3/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
强化学习求助
IWhisper#171
2026/3/19镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
10 条回复
有没有做强化学习的大佬,有偿咨询求助一下,老师让复现一篇论文,整了一个月了死活整不出来,俺不中咧<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">
传统的强化学习,不是llm的<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br>【 在 IWhisper#425 的大作中提到: 】<br><font class="f006">: llm的强化学习还是传统强化学习 </font>
论文发一下看看<img src="/img/ubb/em/11.gif" alt="em11" style="display:inline;border-style:none">
为了保护大佬们的隐私,我留下我的QQ如果能为小弟指点迷津的,请加我QQ:2912172460<br>【 在 IWhisper#171 的大作中提到: 】<br><font class="f006">: 传统的强化学习,不是llm的<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"> </font>
为了保护大佬们的隐私,我留下我的QQ如果能为小弟指点迷津的,请加我QQ:2912172460<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br>【 在 IWhisper#171 的大作中提到: 】<br><font class="f006">: 有没有做强化学习的大佬,有偿咨询求助一下,老师让复现一篇论文,整了一个月了死活整不出来,俺不中咧<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"> </font>
悄悄话能站内信吗,第一次用不太会用<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br>【 在 IWhisper#446 的大作中提到: 】<br><font class="f006">: 论文发一下看看<img src="/img/ubb/em/11.gif" alt="em11" style="display:inline;border-style:none"> </font>
maddpg<br>【 在 IWhisper#414 的大作中提到: 】<br><font class="f006">: 用的啥算法 </font>
直接发名字呗<img src="/img/ubb/em/18.gif" alt="em18" style="display:inline;border-style:none"><br>【 在 IWhisper#171 的大作中提到: 】<br><font class="f006">: 悄悄话能站内信吗,第一次用不太会用<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"> </font>