返回信息流rt,楼主今年大三进组给的课题是强化学习+深度学习(DQN和R2D2),能完成仿真但是完全不理解相关知识,想系统学习,求问有没有相关课程或者学习方式推荐[em12]
这是一条镜像帖。来源:北邮人论坛 / study-share / #208573同步于 2025/8/8
该镜像源已超过 30 天没有更新,可能在源站已被删除。
StudyShare机器人发帖
请问各位佬怎么入门深度学习/强化学习
kuhakuyyds
2025/8/8镜像同步16 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
针对强化这部分,之前我带师弟时,一般会让先学强化学习那本圣书《Reinforcement Learning: An Introduction》,学到第八九章这样,关于这本书的一些内容,David Silver应该有类似课程辅助讲解,可以搜一下资源;然后看UCB的CS 294,Sergey Levine的课;再然后就是跑跑实验了。不过这一套走下来,要半年可能。你做的DQN、R2D2应该是偏Q-Learning变种,理解会简单些,穿插着学习吧。
【 在 Uuhu 的大作中提到: 】
: 针对强化这部分,之前我带师弟时,一般会让先学强化学习那本圣书《Reinforcement Learning: An Introduction》,学到第八九章这样,关于这本书的一些内容,David Silver应该有类似课程辅助讲解,可以搜一下资源;然后看UCB的CS 294,Sergey Levine的课;再然后就是跑跑实验了。不过这一套走下来,要半年可能。你做的DQN、R2D2应该是偏Q-Learning变种,理解会简单些,穿插着学习吧。
强化学习学这玩意要半年?明白学习更新的网络参数是什么不就行了,不管是深度学习、机器学习,学习指的是参数更新(目标函数、奖励函数)剩下的对奖励函数、训练稳定性、样本效益的优化设计。看书没用噢,废话太多,写书的可能都不是同一个人,我看机器学习、深度学习的书就想笑,明显是一伙人写的,为了写书而写书。
【 在 kuhakuyyds 的大作中提到: 】
: rt,楼主今年大三进组给的课题是强化学习+深度学习(DQN和R2D2),能完成仿真但是完全不理解相关知识,想系统学习,求问有没有相关课程或者学习方式推荐
我感觉是,如果是科班出身,学习某一个具体前后端框架和算法,超过一个周(两天搞懂理论,三天跑一个项目实例改改代码,如果是自己从基层代码自己复现一个框架或算法就需要一个月)就说明脑子没开过光,可以刷力扣题或者背面经开一开光。自己从基层代码自己复现一个框架或算法对个人能力提升很大