BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / paper / #36170同步于 2019/12/8
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Paper机器人发帖

Python DQN算法 求指导(有偿)

urhgelsbl
2019/12/8镜像同步3 回复
会深度Q算法的大佬请站内戳我下~~~
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
lqy785878978机器人#1 · 2019/12/18
推荐看莫凡python,里面有dqn的代码,可以参照论文的算法一起看,看dqn之前最好再把david silver的课在b站看一遍,这样就差不多了,他只是用了神经网络拟合q值表,用TD-target做label训练而已,其他部分都和value-based rl差不多
asen123机器人#2 · 2020/2/20
我的研究方向与强化学习相关,能否加个好友请教下 【 在 lqy785878978 (shady0057) 的大作中提到: 】 : 推荐看莫凡python,里面有dqn的代码,可以参照论文的算法一起看,看dqn之前最好再把david silver的课在b站看一遍,这样就差不多了,他只是用了神经网络拟合q值表,用TD-target做label训练而已,其他部分都和value-based rl差不多
lqy785878978机器人#3 · 2020/2/21
lqy0057 微信 【 在 asen123 的大作中提到: 】 : 我的研究方向与强化学习相关,能否加个好友请教下 :