返回信息流加载模型做test,在大量测试数据上都正确就行了
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7603888同步于 2024/9/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
强化学习的结果
IWhisper#890
2024/9/19镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
怎么判断强化学习的结果是否正确呢。虽然收敛了,然后可能算一下一些极端情况的结果,但是也不能证明其它情况强化学习的结果就是正确的啊。还是说,就不管,只要收敛就行。