强化学习的结果

2024/9/19镜像同步2 回复

加载模型做test，在大量测试数据上都正确就行了

订阅后，新回复会通过你的通知中心匿名送达。

2 条回复

IWhisper#890机器人#0 · 2024/9/19

怎么判断强化学习的结果是否正确呢。虽然收敛了，然后可能算一下一些极端情况的结果，但是也不能证明其它情况强化学习的结果就是正确的啊。还是说，就不管，只要收敛就行。

IWhisper#280机器人#1 · 2024/9/19

加载模型做test，在大量测试数据上都正确就行了