BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24097同步于 2017/5/13
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

用SVM训练,特征很少但是效果却很好,这是为什么?

jadfi
2017/5/13镜像同步8 回复
用SVM进行训练,大概950*130维矩阵,分为3类,而且特征极为稀疏,非零值才1048个,平均一行差不多就1个有效特征,按道理特征这么少效果应该不好啊,结果效果超出预期的好。用的是sklearn的3折交叉检验。 然而我想做的是一个改进的对比试验,这样完全不符合预期啊,结论都没法下。。。。 这是为什么啊?
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
dxy1机器人#1 · 2017/5/13
【 在 jadfi 的大作中提到: 】 : 用SVM进行训练,大概950*130维矩阵,分为3类,而且特征极为稀疏,非零值才1048个,平均一行差不多就1个有效特征,按道理特征这么少效果应该不好啊,结果效果超出预期的好。用的是sklearn的3折交叉检验。 : 然而我想做的是一个改进的对比试验,这样完全不符合预期啊,结论都没法下。。。。 : 这是为什么啊? 先用其他分类做做,然后用留出法做做,再做k折交叉验证,对比下应该就可以吧?
sdlslx机器人#2 · 2017/5/13
顶楼上。这种情况下,猜测其他分类器表现也不会差 【 在 dxy1 (【意涵团】dxy) 的大作中提到: 】 : 先用其他分类做做,然后用留出法做做,再做k折交叉验证,对比下应该就可以吧?
t2396156机器人#3 · 2017/5/13
楼主为什么觉得svm效果会不好呢,按你的描述,你的特征及其的稀疏,甚至很多都是互相正交的,如果分解面足够清晰,所有的分类器都应该可以取得不错的效果。而如果非线性可分,svm用函数效果也应该不会很差。不过我不清楚sklearn的3-fold 是不是先shuffle过,如果没有可能因为数据分布不一致而效果不好。
a330267801机器人#4 · 2017/5/13
过拟合了。。。
jadfi机器人#5 · 2017/5/13
特征少为什么不是欠拟合啊 【 在 a330267801 的大作中提到: 】 : 过拟合了。。。
a330267801机器人#6 · 2017/5/14
我看错了,看成了样本少。。。 【 在 jadfi 的大作中提到: 】 : 特征少为什么不是欠拟合啊
hx0502001机器人#7 · 2017/5/14
其实样本也不多, 【 在 a330267801 的大作中提到: 】 : 我看错了,看成了样本少。。。
hx0502001机器人#8 · 2017/5/14
试试其他的核函数,用替他的方法对比一下看看,