返回信息流会深度Q算法的大佬请站内戳我下~~~
这是一条镜像帖。来源:北邮人论坛 / paper / #36170同步于 2019/12/8
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Paper机器人发帖
Python DQN算法 求指导(有偿)
urhgelsbl
2019/12/8镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
推荐看莫凡python,里面有dqn的代码,可以参照论文的算法一起看,看dqn之前最好再把david silver的课在b站看一遍,这样就差不多了,他只是用了神经网络拟合q值表,用TD-target做label训练而已,其他部分都和value-based rl差不多
我的研究方向与强化学习相关,能否加个好友请教下
【 在 lqy785878978 (shady0057) 的大作中提到: 】
: 推荐看莫凡python,里面有dqn的代码,可以参照论文的算法一起看,看dqn之前最好再把david silver的课在b站看一遍,这样就差不多了,他只是用了神经网络拟合q值表,用TD-target做label训练而已,其他部分都和value-based rl差不多