返回信息流譬如这样一个误差函数,
λ是惩罚因子,这个值我设定以后,他是如何能够通过惩罚防止过拟合的?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #13320同步于 2014/5/9
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
惩罚系数加上去以后到底是怎么起到惩罚作用的?
GentlyGuitar
2014/5/9镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
推荐系统论文啊,公式很熟悉
【 在 GentlyGuitar 的大作中提到: 】
: 譬如这样一个误差函数,
: [upload=1][/upload]
: λ是惩罚因子,这个值我设定以后,他是如何能够通过惩罚防止过拟合的?
【 在 longsail 的大作中提到: 】
: 推荐系统论文啊,公式很熟悉
是啊,Factorization Meets the Neighborhood那篇。。
不用l2的话拟合的“曲线”是比较陡峭,这样在训练样本中可以有较低的误差,但是测试集上因为微小的改变就会对结果产生“剧烈”的变化,所以往往不靠谱,L2约束假设真实的“曲线”是平滑的,可以防止过拟合。
瞎解释的。
【 在 GentlyGuitar 的大作中提到: 】
:
: 那过拟合是如何防止的?
我个人的理解是,人们认为p和q中各个维度的参数应该是不能有过于拟合训练数据的,例如,训练中,为了得到最小的经验误差,使得p或q中某个维度的参数为10000, 另一个维度的参数为0.01,这样就可以认为是过拟合,在训练数据中可能效果好,但是在测试集中会不靠谱。为了防止这种情况,增加L2正则项,这样如果某些参数过大,其L2正则也很大,这样整体的损失函数就会受到“惩罚”。惩罚系数是用来人工调节惩罚到底起多大作用的系数。
【 在 arthur503 的大作中提到: 】
: 我个人的理解是,人们认为p和q中各个维度的参数应该是不能有过于拟合训练数据的,例如,训练中,为了得到最小的经验误差,使得p或q中某个维度的参数为10000, 另一个维度的参数为0.01,这样就可以认为是过拟合,在训练数据中可能效果好,但是在测试集中会不靠谱。为了防止这种情况,增加L2正则项,这样如果某些参数过大,其L2正则也很大,这样整体的损失函数就会受到“惩罚”。惩罚系数是用来人工调节惩罚到底起多大作用的系数。
难道非要这样一个维度是10000、一个维度是0.01的情况才可能过拟合?平滑一点就不会过拟合吗。。过拟合的精确结果一定会更容易导致参数不平滑?
谢谢回复。。。以前只知道这些概念,就囫囵吞枣了,没细想过。
当然不是,这只是举的一个例子,而且并不严格。过拟合我的理解是过分的追求降低模型在训练数据上的损失函数,从而导致训练得到的模型与实际的模型有了偏差,这样的结果就是在测试集上的误差就会与在训练数据上的误差有较大的差距(一般是会变坏)。过拟合应该是“更容易”导致参数不平滑吧,毕竟没有“一定”的事情。
这只是个人的理解,不一定正确。
【 在 GentlyGuitar 的大作中提到: 】
:
: 难道非要这样一个维度是10000、一个维度是0.01的情况才可能过拟合?平滑一点就不会过拟合吗。。过拟合的精确结果一定会更容易导致参数不平滑?
: 谢谢回复。。。以前只知道这些概念,就囫囵吞枣了,没细想过。
这个看看bishop的prml应该可以找到答案吧!!!
【 在 GentlyGuitar 的大作中提到: 】
: 譬如这样一个误差函数,
: [upload=1][/upload]
: λ是惩罚因子,这个值我设定以后,他是如何能够通过惩罚防止过拟合的?