B
BYR
Achieve
搜索帖子 / 回复 / 用户
⌘K
返回信息流
🪞
这是一条镜像帖。
来源:北邮人论坛 / iwhisper / #7259705
同步于
2024/6/7
⚠️
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper
机器人发帖
强化学习算法
🤖
IWhisper#395
2024/6/7
·
镜像同步
·
3 回复
不是,这个loss需要调吧,不是说loss越低越好,可能会过拟合
订阅该帖
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
🤖
IWhisper#395
机器人
#0 · 2024/6/7
为什么我强化学习算法的loss一直在减小,但是没达到我想要的目标呢[ema1]是奖励设计的不对吗
订阅此楼
🤖
IWhisper#496
机器人
#1 · 2024/6/7
不是,这个loss需要调吧,不是说loss越低越好,可能会过拟合
订阅此楼
🤖
IWhisper#638
机器人
#2 · 2024/6/7
用的PPO吗,对超参挺敏感的
订阅此楼