返回信息流最大间隔分离平面的那个推导,没太看懂~~
为什么函数间隔的取值并不影响最优化问题的解呢?我自己理解的是,w改变,也就是分类面的斜率改变,所对应的离分类面最近的点应该也改变才是啊。那所对应的函数间隔还可以归一化处理吗?不太明白这个地方,希望大神指点一下啊~~
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #16261同步于 2015/6/24
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
问大神们一个SVM的问题
l6292
2015/6/24镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
应该是,几何间隔才是真正的“距离”,应该是最后的重点,看书上和一些博客上写的大概都是在间隔一定的情况下,求取能得到最大几何间隔的w,正在学习中..........好多地方还不明白,觉得可以做一些实验,加深一下理解。。。。。。。。。。。。。
个人理解,因为函数间隔与w与b比例相关,所以只要等比例的缩放w和b无论函数间隔取什么样的值都不会影响到w和b的最优解,因为在求几何间隔的时候还要做归一化,除以一个w的范式。
【 在 gomiss 的大作中提到: 】
: 请参考函数间隔定义
函数间隔是|w*x+b|啊,SVM的分类面是最大化几何距离对吧?求最优的w和b,但我的意思是对每个w和b,|w*x+b|都应该是一个变化的量吧?而且x应该表示离分类面最近的那个点,这个也有可能会改变吧。那为什么max:|w*x+b|/||w||等价于1/||w||呢?我就是不太明白为什么可以归一化处理~~
【 在 huihui091234 的大作中提到: 】
: 应该是,几何间隔才是真正的“距离”,应该是最后的重点,看书上和一些博客上写的大概都是在间隔一定的情况下,求取能得到最大几何间隔的w,正在学习中..........好多地方还不明白,觉得可以做一些实验,加深一下理解。。。。。。。。。。。。。
对,是求几何间隔最大的w,但几何间隔应该是|w*x+b|/||w||吧?为什么等价于1/||w||我就不太理解了。。。
个人理解,只要w和b确定了就求出了最优超平面,但是如果w和b同时成比例变化为lambda*w和lambda*b(而不是楼主说的只有w变)函数距离变了,但是超平面没变,这样就会有无穷多解,我们是求不出来的,所以应该加一些不会影响最后解的条件,于是有了归一化的几何距离,同时令w*x+b=1,也就是从那一簇解中强行选了一个,其实令其等于任何一个常数都可以,不知到有没有说清楚。。
【 在 erping 的大作中提到: 】
: 个人理解,只要w和b确定了就求出了最优超平面,但是如果w和b同时成比例变化为lambda*w和lambda*b(而不是楼主说的只有w变)函数距离变了,但是超平面没变,这样就会有无穷多解,我们是求不出来的,所以应该加一些不会影响最后解的条件,于是有了归一化的几何距离,同时令w*x+b=1,也就是从那一簇解中强行选了一个,其实令其等于任何一个常数都可以,不知到有没有说清楚。。
啊,我也突然想明白了~我现在这样理解的:原最优化问题求的是max:r^/||w||,得到了最优的w,和b。但因为w和b成比例增加不会改变所对应的分类面,所以可以求:max:1/||w/r^||把得到的w/r^作为最优的w。也是对应着原最优化问题求出的分类面的。这样理解对吧?