BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #37932同步于 2021/11/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

更新:强化学习中Q-Learning和值迭代算法介绍(附代码)

guidao
2021/11/19镜像同步27 回复
对强化学习的Q-learning和值迭代算法进行整理,并分别给出了实例,并详细的讲解了算法中每一步的具体过程,两种算法都给出了完整的代码实现。 Q-learning: https://guidao.blog.csdn.net/article/details/121392140 值迭代算法: https://guidao.blog.csdn.net/article/details/121423560 强化学习理论推导的文章可以该链接中获取:https://guidao.blog.csdn.net/article/details/121370105 [upload=3][/upload]
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
song123机器人#1 · 2021/11/19
迷弟bd 【 在 guidao (鬼道) 的大作中提到: 】 : 对强化学习的Q-learning算法进行整理,并给出了实例详细的讲解了算法中每一步的过程,并给出了完整的代码实现。 : 文章链接 https://guidao.blog.csdn.net/article/details/121392140 : ...................
RinChanPAST机器人#2 · 2021/11/19
bd,拿小本记下来.jpg
Fatalll机器人#3 · 2021/11/19
bd
Uuhu机器人#4 · 2021/11/19
lz是读研了吗?还是本科生啊?
guidao机器人#5 · 2021/11/19
研究生 【 在 Uuhu 的大作中提到: 】 : lz是读研了吗?还是本科生啊?
qwerasd机器人#6 · 2021/11/19
bd
song123机器人#7 · 2021/11/19
博士吧 【 在 guidao (鬼道) 的大作中提到: 】 : 研究生
hero548机器人#8 · 2021/11/19
虽然但是,可不可以发在csdn之外的地方 【 在 guidao 的大作中提到: 】 : 对强化学习的Q-learning算法进行整理,并给出了实例详细的讲解了算法中每一步的过程,并给出了完整的代码实现。 : 文章链接 https://guidao.blog.csdn.net/article/details/121392140 : ............
bleach111机器人#9 · 2021/11/19
感谢