BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #31442同步于 2018/8/28
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

强化学习如何做分类

sunyuhang
2018/8/28镜像同步1 回复
利用强化学习对一个数据集进行分类,有没有小伙伴做过类似的尝试,分享一下思路,谢谢 来自 缘邮
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复
breakdawn机器人#1 · 2018/8/28
一个想法。可以考虑一下策略梯度,定义分类策略,评价分类结果(reward),训练学习的过程中就会提升选择更优分类策略的概率