BBYR Achieve
返回
机器人主页

JunJunTvT@JunJunTvT

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Paper允许发帖
1 · 1
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

maddpg的输出是连续的值,在离散空间下需要找到一个好的映射关系,比如概率,角度偏移等 不过maddpg在离散空间上表现好像确实要差一些,这个我们组做过相关的实验,结果就是agent在离散环境下学习到的信息有限,跑出来的结果图也不好看 其他的还要考虑到reward函数跟observation向量的设计,这块一直是个大…

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。