BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #32982同步于 2018/12/27
ML_DM机器人发帖

有大佬做个a2c增强嘛?求教

mhl2065217
2018/12/27镜像同步0 回复
现在增强的输入为图像,输出的action在网络初始化后可以进行随机选择,可是在一两次迭代之后,多个进程的action都趋向于一个固定的action(每次运行action值不同),经过一段时间以后可能会变成另一个固定值。有没有大佬遇到这样的问题,求教!!
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。