BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #18422同步于 2016/2/2
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

求问svm是否适合多元情况下的分类预测?

totti90556
2016/2/2镜像同步12 回复
本渣最近做了一个预测模型,会需要多元回归做分类预测。一开始用的lr,加入更多提取出来的自变量,正常情况下会提升模型效果。后来在单元情况下试用了svm,效果比lr单元好很多。但问题也很多,目前主要有三个问题: 1.svm加入之前的其他自变量,只存在削弱模型效果的情况,居然没有一个会提升模型效果。 2.自变量做不做标准化去除量纲影响,结果差别很大。 3.选出的优质数据集重新放入svm训练,结果居然还不如全数据集 求大神帮忙解释!还是研一的渣渣。。搞不太懂算法的东西。。求解释通俗易懂,多谢了! 发自「贵邮」
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
sdlslx机器人#1 · 2016/2/3
预测,私以为svr比svc合适吧
icybee机器人#2 · 2016/2/3
摸摸头,楼主是否从特征方面考虑过?如果特征选取不好的话在模型上肯定会有各种反常现象,还有就是楼主可以根据实际需求多尝试几个模型,特征纬度高的时候lr和svm不一定合适
hyx2011机器人#3 · 2016/2/3
不同的模型对于feature的要求不一样,在lr上适用的feature对于svm不一定适用。想问楼主的优质数据是如何选择的?
totti90556机器人#4 · 2016/2/3
嗯多谢!打算再试试随机森林,特征的话我有点改不动。。其实提取特征的领域和要预测指标的领域离得有点远,实在不容易想到优质特征 【 在 icybee 的大作中提到: 】 : 摸摸头,楼主是否从特征方面考虑过?如果特征选取不好的话在模型上肯定会有各种反常现象,还有就是楼主可以根据实际需求多尝试几个模型,特征纬度高的时候lr和svm不一定合适 : 发自「贵邮」
totti90556机器人#5 · 2016/2/3
就是根据准确率和召回率选的。。比如有300块数据,我挑出来两个都大于0.7的,然后把这些选出来的作为新的训练集这样,结果的话准确率差不多还有0.7,召回直接掉到0.4几 【 在 hyx2011 的大作中提到: 】 : 不同的模型对于feature的要求不一样,在lr上适用的feature对于svm不一定适用。想问楼主的优质数据是如何选择的? : 发自「贵邮」
hyx2011机器人#6 · 2016/2/3
这样挑选可能会造成过拟合吧感觉? 【 在 totti90556 的大作中提到: 】 : 就是根据准确率和召回率选的。。比如有300块数据,我挑出来两个都大于0.7的,然后把这些选出来的作为新的训练集这样,结果的话准确率差不多还有0.7,召回直接掉到0.4几 : : 发自「贵邮」
totti90556机器人#7 · 2016/2/3
是。。我也觉得应该是过拟合。。 【 在 hyx2011 的大作中提到: 】 : 这样挑选可能会造成过拟合吧感觉? : 【 在 totti90556 的大作中提到: 】 : : 就是根据准确率和召回率选的。。比如有300块数据,我挑出来两个都大于0.7的,然后把这些选出来的作为新的 : ......... 发自「贵邮」
phantomlyc机器人#8 · 2016/2/3
第三条的优质数据集是什么?如果要做重训练是把false positive的数据再加到数据集里训练的。。 另外不是很明白自变量的含义。
LJ10211289机器人#9 · 2016/2/4
可以确切地告诉你,对于线性模型的训练都是应该做特征归一化处理的。至于其他两点的验证都应该在“特征归一化”的基础进行实验,要不然你的实验结果都没有意义。 【 在 totti90556 的大作中提到: 】 : 本渣最近做了一个预测模型,会需要多元回归做分类预测。一开始用的lr,加入更多提取出来的自变量,正常情况下会提升模型效果。后来在单元情况下试用了svm,效果比lr单元好很多。但问题也很多,目前主要有三个问题: : 1.svm加入之前的其他自变量,只存在削弱模型效果的情况,居然没有一个会提升模型效果。 : 2.自变量做不做标准化去除量纲影响,结果差别很大。 : ...................