返回信息流本渣最近做了一个预测模型,会需要多元回归做分类预测。一开始用的lr,加入更多提取出来的自变量,正常情况下会提升模型效果。后来在单元情况下试用了svm,效果比lr单元好很多。但问题也很多,目前主要有三个问题:
1.svm加入之前的其他自变量,只存在削弱模型效果的情况,居然没有一个会提升模型效果。
2.自变量做不做标准化去除量纲影响,结果差别很大。
3.选出的优质数据集重新放入svm训练,结果居然还不如全数据集
求大神帮忙解释!还是研一的渣渣。。搞不太懂算法的东西。。求解释通俗易懂,多谢了!
发自「贵邮」
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #18422同步于 2016/2/2
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
求问svm是否适合多元情况下的分类预测?
totti90556
2016/2/2镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
摸摸头,楼主是否从特征方面考虑过?如果特征选取不好的话在模型上肯定会有各种反常现象,还有就是楼主可以根据实际需求多尝试几个模型,特征纬度高的时候lr和svm不一定合适
嗯多谢!打算再试试随机森林,特征的话我有点改不动。。其实提取特征的领域和要预测指标的领域离得有点远,实在不容易想到优质特征
【 在 icybee 的大作中提到: 】
: 摸摸头,楼主是否从特征方面考虑过?如果特征选取不好的话在模型上肯定会有各种反常现象,还有就是楼主可以根据实际需求多尝试几个模型,特征纬度高的时候lr和svm不一定合适
:
发自「贵邮」
就是根据准确率和召回率选的。。比如有300块数据,我挑出来两个都大于0.7的,然后把这些选出来的作为新的训练集这样,结果的话准确率差不多还有0.7,召回直接掉到0.4几
【 在 hyx2011 的大作中提到: 】
: 不同的模型对于feature的要求不一样,在lr上适用的feature对于svm不一定适用。想问楼主的优质数据是如何选择的?
:
发自「贵邮」
这样挑选可能会造成过拟合吧感觉?
【 在 totti90556 的大作中提到: 】
: 就是根据准确率和召回率选的。。比如有300块数据,我挑出来两个都大于0.7的,然后把这些选出来的作为新的训练集这样,结果的话准确率差不多还有0.7,召回直接掉到0.4几
:
: 发自「贵邮」
是。。我也觉得应该是过拟合。。
【 在 hyx2011 的大作中提到: 】
: 这样挑选可能会造成过拟合吧感觉?
: 【 在 totti90556 的大作中提到: 】
: : 就是根据准确率和召回率选的。。比如有300块数据,我挑出来两个都大于0.7的,然后把这些选出来的作为新的
: .........
发自「贵邮」
可以确切地告诉你,对于线性模型的训练都是应该做特征归一化处理的。至于其他两点的验证都应该在“特征归一化”的基础进行实验,要不然你的实验结果都没有意义。
【 在 totti90556 的大作中提到: 】
: 本渣最近做了一个预测模型,会需要多元回归做分类预测。一开始用的lr,加入更多提取出来的自变量,正常情况下会提升模型效果。后来在单元情况下试用了svm,效果比lr单元好很多。但问题也很多,目前主要有三个问题:
: 1.svm加入之前的其他自变量,只存在削弱模型效果的情况,居然没有一个会提升模型效果。
: 2.自变量做不做标准化去除量纲影响,结果差别很大。
: ...................