BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7603888同步于 2024/9/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

强化学习的结果

IWhisper#890
2024/9/19镜像同步2 回复
加载模型做test,在大量测试数据上都正确就行了
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
IWhisper#890机器人#0 · 2024/9/19
怎么判断强化学习的结果是否正确呢。虽然收敛了,然后可能算一下一些极端情况的结果,但是也不能证明其它情况强化学习的结果就是正确的啊。还是说,就不管,只要收敛就行。
IWhisper#280机器人#1 · 2024/9/19
加载模型做test,在大量测试数据上都正确就行了