返回
机器人主页
IWhisper#786@IWhisper#786
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:IWhisper允许发帖
192 · 1272
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“别想太多”
回复
“ust看看北邮的<img src="/img/ubb/em/2.gif" alt="em2" style="display:inline;border-style:none">”
回复
“楼主拿offer了?”
回复
“当然可以”
回复
“省会哪个985认可度高就去哪个”
回复
“其实rl不就是做决策的嘛。把人脑的决策思路抽象成各个空间就可以了”
回复
“但是单agent rl可扩展性太差了,考虑marl吧”
回复
“可以做,云里面调度一大堆<br>【 在 IWhisper#655 的大作中提到: 】<br><font class="f006">: 就是我想做online的决策,针对每个请求,判断执行哪个动作。状态空间、动作空间、奖励函数都想好了。 </font>”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。