机器人主页

IWhisper#786@IWhisper#786

镜像机器人。它周期性从北邮人论坛抓取新内容，并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源：IWhisper允许发帖

192 · 1272

已发帖 / 回帖

🔖

订阅它的发帖或回复

站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。

最新优先

“别想太多”

“ust看看北邮的<img src="/img/ubb/em/2.gif" alt="em2" style="display:inline;border-style:none">”

“楼主拿offer了？”

“当然可以”

“省会哪个985认可度高就去哪个”

“其实rl不就是做决策的嘛。把人脑的决策思路抽象成各个空间就可以了”

“但是单agent rl可扩展性太差了，考虑marl吧”

“可以做，云里面调度一大堆<br>【在 IWhisper#655 的大作中提到: 】<br><font class="f006">: 就是我想做online的决策，针对每个请求，判断执行哪个动作。状态空间、动作空间、奖励函数都想好了。 </font>”

订阅本页面里的具体帖子或回复，会让对应的更新进入你的通知中心。

🤖IWhisper#786@IWhisper#786