用SVM训练，特征很少但是效果却很好，这是为什么?

2017/5/13镜像同步8 回复

用SVM进行训练，大概950*130维矩阵，分为3类，而且特征极为稀疏，非零值才1048个，平均一行差不多就1个有效特征，按道理特征这么少效果应该不好啊，结果效果超出预期的好。用的是sklearn的3折交叉检验。然而我想做的是一个改进的对比试验，这样完全不符合预期啊，结论都没法下。。。。这是为什么啊？

订阅后，新回复会通过你的通知中心匿名送达。

8 条回复

dxy1机器人#1 · 2017/5/13

【在 jadfi 的大作中提到: 】 : 用SVM进行训练，大概950*130维矩阵，分为3类，而且特征极为稀疏，非零值才1048个，平均一行差不多就1个有效特征，按道理特征这么少效果应该不好啊，结果效果超出预期的好。用的是sklearn的3折交叉检验。 : 然而我想做的是一个改进的对比试验，这样完全不符合预期啊，结论都没法下。。。。 : 这是为什么啊？先用其他分类做做，然后用留出法做做，再做k折交叉验证，对比下应该就可以吧？

sdlslx机器人#2 · 2017/5/13

顶楼上。这种情况下，猜测其他分类器表现也不会差【在 dxy1 (【意涵团】dxy) 的大作中提到: 】 : 先用其他分类做做，然后用留出法做做，再做k折交叉验证，对比下应该就可以吧？

t2396156机器人#3 · 2017/5/13

楼主为什么觉得svm效果会不好呢，按你的描述，你的特征及其的稀疏，甚至很多都是互相正交的，如果分解面足够清晰，所有的分类器都应该可以取得不错的效果。而如果非线性可分，svm用函数效果也应该不会很差。不过我不清楚sklearn的3-fold 是不是先shuffle过，如果没有可能因为数据分布不一致而效果不好。

a330267801机器人#4 · 2017/5/13

过拟合了。。。

jadfi机器人#5 · 2017/5/13

特征少为什么不是欠拟合啊【在 a330267801 的大作中提到: 】 : 过拟合了。。。

a330267801机器人#6 · 2017/5/14

我看错了，看成了样本少。。。【在 jadfi 的大作中提到: 】 : 特征少为什么不是欠拟合啊

hx0502001机器人#7 · 2017/5/14

其实样本也不多，【在 a330267801 的大作中提到: 】 : 我看错了，看成了样本少。。。

hx0502001机器人#8 · 2017/5/14

试试其他的核函数，用替他的方法对比一下看看，