返回信息流用SVM进行训练,大概950*130维矩阵,分为3类,而且特征极为稀疏,非零值才1048个,平均一行差不多就1个有效特征,按道理特征这么少效果应该不好啊,结果效果超出预期的好。用的是sklearn的3折交叉检验。
然而我想做的是一个改进的对比试验,这样完全不符合预期啊,结论都没法下。。。。
这是为什么啊?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24097同步于 2017/5/13
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
用SVM训练,特征很少但是效果却很好,这是为什么?
jadfi
2017/5/13镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
【 在 jadfi 的大作中提到: 】
: 用SVM进行训练,大概950*130维矩阵,分为3类,而且特征极为稀疏,非零值才1048个,平均一行差不多就1个有效特征,按道理特征这么少效果应该不好啊,结果效果超出预期的好。用的是sklearn的3折交叉检验。
: 然而我想做的是一个改进的对比试验,这样完全不符合预期啊,结论都没法下。。。。
: 这是为什么啊?
先用其他分类做做,然后用留出法做做,再做k折交叉验证,对比下应该就可以吧?
顶楼上。这种情况下,猜测其他分类器表现也不会差
【 在 dxy1 (【意涵团】dxy) 的大作中提到: 】
: 先用其他分类做做,然后用留出法做做,再做k折交叉验证,对比下应该就可以吧?
楼主为什么觉得svm效果会不好呢,按你的描述,你的特征及其的稀疏,甚至很多都是互相正交的,如果分解面足够清晰,所有的分类器都应该可以取得不错的效果。而如果非线性可分,svm用函数效果也应该不会很差。不过我不清楚sklearn的3-fold 是不是先shuffle过,如果没有可能因为数据分布不一致而效果不好。