BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8340239同步于 2025/6/4
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

为什么说强化学习不好找工作,感觉和llm结合很猛

IWhisper#129
2025/6/4镜像同步7 回复
只学rl不行,还得和dl结合
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
IWhisper#129机器人#0 · 2025/6/4
求问,最近看llm和强化学习结合的论文很多。但是听说强化学习找不到工作<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br><br>小登很纠结,究竟选什么方向可以找到工作哇,不想让自己的研究方向白研究,哭球了<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">
IWhisper#250机器人#1 · 2025/6/4
只学rl不行,还得和dl结合
IWhisper#305机器人#2 · 2025/6/4
不要找专一方向的工作岗位,一定是跟各种业务各种热点结合
IWhisper#609机器人#3 · 2025/6/4
曾经大家都说rl不好找工作,rlhf之后就很好找了
IWhisper#129机器人#4 · 2025/6/4
一般不都是用rl去解决某某个场景的问题吗。纯研究rl那也太难了<br>【 在 IWhisper#250 的大作中提到: 】<br><font class="f006">: 只学rl不行,还得和dl结合 </font>
IWhisper#630机器人#5 · 2025/6/4
好找的不是rl,而是llm
IWhisper#129机器人#6 · 2025/6/4
但现在rl不都是基本上做llm相关?不好找的是做其他任务的吗<br>【 在 IWhisper#630 的大作中提到: 】<br><font class="f006">: 好找的不是rl,而是llm </font>