求问svm是否适合多元情况下的分类预测？

2016/2/2镜像同步12 回复

本渣最近做了一个预测模型，会需要多元回归做分类预测。一开始用的lr，加入更多提取出来的自变量，正常情况下会提升模型效果。后来在单元情况下试用了svm，效果比lr单元好很多。但问题也很多，目前主要有三个问题： 1.svm加入之前的其他自变量，只存在削弱模型效果的情况，居然没有一个会提升模型效果。 2.自变量做不做标准化去除量纲影响，结果差别很大。 3.选出的优质数据集重新放入svm训练，结果居然还不如全数据集求大神帮忙解释！还是研一的渣渣。。搞不太懂算法的东西。。求解释通俗易懂，多谢了！发自「贵邮」

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

sdlslx机器人#1 · 2016/2/3

预测，私以为svr比svc合适吧

icybee机器人#2 · 2016/2/3

摸摸头，楼主是否从特征方面考虑过？如果特征选取不好的话在模型上肯定会有各种反常现象，还有就是楼主可以根据实际需求多尝试几个模型，特征纬度高的时候lr和svm不一定合适

hyx2011机器人#3 · 2016/2/3

不同的模型对于feature的要求不一样，在lr上适用的feature对于svm不一定适用。想问楼主的优质数据是如何选择的？

totti90556机器人#4 · 2016/2/3

嗯多谢！打算再试试随机森林，特征的话我有点改不动。。其实提取特征的领域和要预测指标的领域离得有点远，实在不容易想到优质特征【在 icybee 的大作中提到: 】 : 摸摸头，楼主是否从特征方面考虑过？如果特征选取不好的话在模型上肯定会有各种反常现象，还有就是楼主可以根据实际需求多尝试几个模型，特征纬度高的时候lr和svm不一定合适 : 发自「贵邮」

totti90556机器人#5 · 2016/2/3

就是根据准确率和召回率选的。。比如有300块数据，我挑出来两个都大于0.7的，然后把这些选出来的作为新的训练集这样，结果的话准确率差不多还有0.7，召回直接掉到0.4几【在 hyx2011 的大作中提到: 】 : 不同的模型对于feature的要求不一样，在lr上适用的feature对于svm不一定适用。想问楼主的优质数据是如何选择的？ : 发自「贵邮」

hyx2011机器人#6 · 2016/2/3

这样挑选可能会造成过拟合吧感觉？【在 totti90556 的大作中提到: 】 : 就是根据准确率和召回率选的。。比如有300块数据，我挑出来两个都大于0.7的，然后把这些选出来的作为新的训练集这样，结果的话准确率差不多还有0.7，召回直接掉到0.4几 : : 发自「贵邮」

totti90556机器人#7 · 2016/2/3

是。。我也觉得应该是过拟合。。【在 hyx2011 的大作中提到: 】 : 这样挑选可能会造成过拟合吧感觉？ : 【在 totti90556 的大作中提到: 】 : : 就是根据准确率和召回率选的。。比如有300块数据，我挑出来两个都大于0.7的，然后把这些选出来的作为新的 : ......... 发自「贵邮」

phantomlyc机器人#8 · 2016/2/3

第三条的优质数据集是什么？如果要做重训练是把false positive的数据再加到数据集里训练的。。另外不是很明白自变量的含义。

LJ10211289机器人#9 · 2016/2/4

可以确切地告诉你，对于线性模型的训练都是应该做特征归一化处理的。至于其他两点的验证都应该在“特征归一化”的基础进行实验，要不然你的实验结果都没有意义。【在 totti90556 的大作中提到: 】 : 本渣最近做了一个预测模型，会需要多元回归做分类预测。一开始用的lr，加入更多提取出来的自变量，正常情况下会提升模型效果。后来在单元情况下试用了svm，效果比lr单元好很多。但问题也很多，目前主要有三个问题： : 1.svm加入之前的其他自变量，只存在削弱模型效果的情况，居然没有一个会提升模型效果。 : 2.自变量做不做标准化去除量纲影响，结果差别很大。 : ...................