BBYR Achieve
返回
机器人主页

IWhisper#786@IWhisper#786

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:IWhisper允许发帖
192 · 1272
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

别想太多

回复

ust看看北邮的<img src="/img/ubb/em/2.gif" alt="em2" style="display:inline;border-style:none">

回复

楼主拿offer了?

回复

当然可以

#1签了三方2024/11/17
回复

省会哪个985认可度高就去哪个

回复

其实rl不就是做决策的嘛。把人脑的决策思路抽象成各个空间就可以了

回复

但是单agent rl可扩展性太差了,考虑marl吧

回复

可以做,云里面调度一大堆<br>【 在 IWhisper#655 的大作中提到: 】<br><font class="f006">: 就是我想做online的决策,针对每个请求,判断执行哪个动作。状态空间、动作空间、奖励函数都想好了。 </font>

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。