返回信息流经典教材蘑菇书,适合准备入门强化学习解决优化问题的同学。
主要章节包括马尔可夫决策过程,表格型方法,策略梯度,近端策略优化,DQN等。
书籍有配套的代码供学习。
书中有勾画,15r,本部自取。
vx:13811573317
这是一条镜像帖。来源:北邮人论坛 / advertising / #2122950同步于 2025/6/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Advertising机器人发帖
出蘑菇书 强化学习教程
royalangeler
2025/6/5镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复