返回信息流小弟最近在做图像识别,用到liblinear工具。可是却发现当我输出probability时,准确
率比没有输出时差了好多好多!
没办法,在网上找了半天,只找到了FAQ中提到的一句话,我也不是很懂。可关键是相差
太多了,我就实在是摸不着头脑阿。
对了,我的样本数现在还很少,只有102*108,102是样本数,108是特征维数。是不是因
为样本太少了的缘故阿?
小弟初学图像识别和分类,望各位大牛指教指教阿。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #8152同步于 2011/8/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
liblinear 在预测时如果让b选项为1的话,得出来的结果相差很大
allenbo
2011/8/7镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
自己可以读读作者给的文档,
作为分类问题, liblinear是不提供输出概率的,
-b是给回归问题是用的一个概率, 如果需要概率需要进入到工具中该几行,然后重新编译一下,
具体可以用sigmoid方法生成概率, 所以如果加上-b选项就不是分类问题了, 那么你这点数据不可能被拟合, 分类应该没有问题,
对于你现在的问题, 维度也不是很高, 用libsvm加非线性核(Chi_square, Histogram intersection)会更好.
自己把Readme仔细读读。。。
【 在 allenbo 的大作中提到: 】
: 小弟最近在做图像识别,用到liblinear工具。可是却发现当我输出probability时,准确
: 率比没有输出时差了好多好多!
: 没办法,在网上找了半天,只找到了FAQ中提到的一句话,我也不是很懂。可关键是相差
: ...................
我现在是这一个toy数据集上试试linear能不能正常运行。要是正常的话会移到服务器上
跑大数据的。如果我以前用过linear跑过20000*40000的大数据,当时跑的结果也还行。
所以我寻思着是不是样本太少的关系!要是那样的话,我就直接跑服务器了。
【 在 slayer0421 (SKYWALKER) 的大作中提到: 】
: 我缺只有这么点特征这么点样本泛化性当然不高
谢谢你了,回答的好详细阿。我再仔细看看。现在才刚刚开始做项目,很多不懂。谢谢拉
。
【 在 luoye (清风) 的大作中提到: 】
: 自己可以读读作者给的文档,
: 作为分类问题, liblinear是不提供输出概率的,
: -b是给回归问题是用的一个概率, 如果需要概率需要进入到工具中该几行,然后重新
: 编译一下,
: ...................
【 在 luoye 的大作中提到: 】
: 自己可以读读作者给的文档,
: 作为分类问题, liblinear是不提供输出概率的,
: -b是给回归问题是用的一个概率, 如果需要概率需要进入到工具中该几行,然后重新编译一下,
: ...................
对于2类分类中,-b之后输出到指定文件中的第2列不就是概率p吗?第三列相当于1-p。如果做ROC之类的话,用这个难道不行?不知道你指的概率是啥~ 多类的?
求指教
不要让liblinear输出概率,这个可以自己算,对求得的结果做logistic regression 就可以了 p = 1./(1+exp(-a*x));