返回信息流对强化学习的Q-learning和值迭代算法进行整理,并分别给出了实例,并详细的讲解了算法中每一步的具体过程,两种算法都给出了完整的代码实现。
Q-learning: https://guidao.blog.csdn.net/article/details/121392140
值迭代算法: https://guidao.blog.csdn.net/article/details/121423560
强化学习理论推导的文章可以该链接中获取:https://guidao.blog.csdn.net/article/details/121370105
[upload=3][/upload]
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #37932同步于 2021/11/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
更新:强化学习中Q-Learning和值迭代算法介绍(附代码)
guidao
2021/11/19镜像同步27 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
迷弟bd
【 在 guidao (鬼道) 的大作中提到: 】
: 对强化学习的Q-learning算法进行整理,并给出了实例详细的讲解了算法中每一步的过程,并给出了完整的代码实现。
: 文章链接 https://guidao.blog.csdn.net/article/details/121392140
: ...................
虽然但是,可不可以发在csdn之外的地方
【 在 guidao 的大作中提到: 】
: 对强化学习的Q-learning算法进行整理,并给出了实例详细的讲解了算法中每一步的过程,并给出了完整的代码实现。
: 文章链接 https://guidao.blog.csdn.net/article/details/121392140
: ............