返回信息流只学rl不行,还得和dl结合
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8340239同步于 2025/6/4
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
为什么说强化学习不好找工作,感觉和llm结合很猛
IWhisper#129
2025/6/4镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
求问,最近看llm和强化学习结合的论文很多。但是听说强化学习找不到工作<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br><br>小登很纠结,究竟选什么方向可以找到工作哇,不想让自己的研究方向白研究,哭球了<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">
一般不都是用rl去解决某某个场景的问题吗。纯研究rl那也太难了<br>【 在 IWhisper#250 的大作中提到: 】<br><font class="f006">: 只学rl不行,还得和dl结合 </font>
但现在rl不都是基本上做llm相关?不好找的是做其他任务的吗<br>【 在 IWhisper#630 的大作中提到: 】<br><font class="f006">: 好找的不是rl,而是llm </font>