返回信息流andrew课里说的gradient checking,是不是就在排除局部最优解?
发自「贵邮」
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #20325同步于 2016/6/8
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
keras+theano如何判断训练结果是不是局部最优解?
jiumi
2016/6/8镜像同步11 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
只要你优化的目标函数是non-convex的,你得到的最优解都是局部最优解。用sgd优化时并不是loss不变了就说明收敛到局部最优解了,还要check一下hessian防止落入saddle point
最后一句话看不懂了,,可以说一下,怎样避免局部最优解么
【 在 sartresh 的大作中提到: 】
: 只要你优化的目标函数是non-convex的,你得到的最优解都是局部最优解。用sgd优化时并不是loss不变了就说明收敛到局部最优解了,还要check一下hessian防止落入saddle point
: .........
发自「贵邮」
谢谢啊
【 在 moonfighting 的大作中提到: 】
: gredient check是用来检查你的code算梯度的方法对不对的x, 和局部最优解没关系
:
: 发自「贵邮」
:
发自「贵邮」
并不能得到全局最优解,而是考虑如何得到好的局部最优解
【 在 jiumi 的大作中提到: 】
: 最后一句话看不懂了,,可以说一下,怎样避免局部最优解么
:
: 【 在 sartresh 的大作中提到: 】
: : 只要你优化的目标函数是non-convex的,你得到的最优解都是局部最优解。用s
: .........
发自「贵邮」
【 在 jiumi 的大作中提到: 】
: 最后一句话看不懂了,,可以说一下,怎样避免局部最优解么
:
: 发自「贵邮」
他说的是鞍点,跳出鞍点后 loss 还能再降。NIPS 上有好多论文讨论这些内容。
用现在的 loss 函数是避免不了局部解,不过你找到的局部解也都是质量不错的解,放心用就行了。
【 在 sartresh 的大作中提到: 】
: 只要你优化的目标函数是non-convex的,你得到的最优解都是局部最优解。用sgd优化时并不是loss不变了就说明收敛到局部最优解了,还要check一下hessian防止落入saddle point