BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #8152同步于 2011/8/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

liblinear 在预测时如果让b选项为1的话,得出来的结果相差很大

allenbo
2011/8/7镜像同步7 回复
小弟最近在做图像识别,用到liblinear工具。可是却发现当我输出probability时,准确 率比没有输出时差了好多好多! 没办法,在网上找了半天,只找到了FAQ中提到的一句话,我也不是很懂。可关键是相差 太多了,我就实在是摸不着头脑阿。 对了,我的样本数现在还很少,只有102*108,102是样本数,108是特征维数。是不是因 为样本太少了的缘故阿? 小弟初学图像识别和分类,望各位大牛指教指教阿。
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
allenbo机器人#1 · 2011/8/7
好吧,自顶
slayer0421机器人#2 · 2011/8/7
我缺只有这么点特征这么点样本泛化性当然不高
luoye机器人#3 · 2011/8/8
自己可以读读作者给的文档, 作为分类问题, liblinear是不提供输出概率的, -b是给回归问题是用的一个概率, 如果需要概率需要进入到工具中该几行,然后重新编译一下, 具体可以用sigmoid方法生成概率, 所以如果加上-b选项就不是分类问题了, 那么你这点数据不可能被拟合, 分类应该没有问题, 对于你现在的问题, 维度也不是很高, 用libsvm加非线性核(Chi_square, Histogram intersection)会更好. 自己把Readme仔细读读。。。 【 在 allenbo 的大作中提到: 】 : 小弟最近在做图像识别,用到liblinear工具。可是却发现当我输出probability时,准确 : 率比没有输出时差了好多好多! : 没办法,在网上找了半天,只找到了FAQ中提到的一句话,我也不是很懂。可关键是相差 : ...................
allenbo机器人#4 · 2011/8/8
我现在是这一个toy数据集上试试linear能不能正常运行。要是正常的话会移到服务器上 跑大数据的。如果我以前用过linear跑过20000*40000的大数据,当时跑的结果也还行。 所以我寻思着是不是样本太少的关系!要是那样的话,我就直接跑服务器了。 【 在 slayer0421 (SKYWALKER) 的大作中提到: 】 : 我缺只有这么点特征这么点样本泛化性当然不高
allenbo机器人#5 · 2011/8/8
谢谢你了,回答的好详细阿。我再仔细看看。现在才刚刚开始做项目,很多不懂。谢谢拉 。 【 在 luoye (清风) 的大作中提到: 】 : 自己可以读读作者给的文档, : 作为分类问题, liblinear是不提供输出概率的, : -b是给回归问题是用的一个概率, 如果需要概率需要进入到工具中该几行,然后重新 : 编译一下, : ...................
nese机器人#6 · 2011/9/1
【 在 luoye 的大作中提到: 】 : 自己可以读读作者给的文档, : 作为分类问题, liblinear是不提供输出概率的, : -b是给回归问题是用的一个概率, 如果需要概率需要进入到工具中该几行,然后重新编译一下, : ................... 对于2类分类中,-b之后输出到指定文件中的第2列不就是概率p吗?第三列相当于1-p。如果做ROC之类的话,用这个难道不行?不知道你指的概率是啥~ 多类的? 求指教
bebekifis机器人#7 · 2011/9/4
不要让liblinear输出概率,这个可以自己算,对求得的结果做logistic regression 就可以了 p = 1./(1+exp(-a*x));