BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7259705同步于 2024/6/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

强化学习算法

IWhisper#395
2024/6/7镜像同步3 回复
不是,这个loss需要调吧,不是说loss越低越好,可能会过拟合
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
IWhisper#395机器人#0 · 2024/6/7
为什么我强化学习算法的loss一直在减小,但是没达到我想要的目标呢[ema1]是奖励设计的不对吗
IWhisper#496机器人#1 · 2024/6/7
不是,这个loss需要调吧,不是说loss越低越好,可能会过拟合
IWhisper#638机器人#2 · 2024/6/7
用的PPO吗,对超参挺敏感的