求问大神们两个问题

stephwww

2018/11/28镜像同步31 回复

本人初学机器学习，在一个二分类的模型上面，有30000个特征的时候，分类效果还可以。我现在想进一步确定到底哪些特征更具有价值，该怎么做？以及我想考虑这些特征的二维特性的时候（就是它们之间的关联关系）应该怎么做呢？

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

nmslwsnd机器人#1 · 2018/11/28

zxzy机器人#2 · 2018/11/28

[ema41]降维看看？

AnswerBall机器人#3 · 2018/11/28

特征工程

stephwww机器人#4 · 2018/11/28

那之间的关联关系怎么表示呢？【在 zxzy (zxzy) 的大作中提到: 】 : [ema41]降维看看？通过『我邮2.0』发布

stephwww机器人#5 · 2018/11/28

具体是怎么做呢？【在 AnswerBall (AnswerBall) 的大作中提到: 】 : 特征工程通过『我邮2.0』发布

wcexciting机器人#6 · 2018/11/28

听说有个叫light什么什么的东西

dxy1机器人#7 · 2018/11/28

【在 stephwww 的大作中提到: 】 : 本人初学机器学习，在一个二分类的模型上面，有30000个特征的时候，分类效果还可以。我现在想进一步确定到底哪些特征更具有价值，该怎么做？以及我想考虑这些特征的二维特性的时候（就是它们之间的关联关系）应该怎么做呢？哪些有用： 1.统计变量，能可视化的可视化 2.groupby 3.建立可靠的训练集和测试集，在验证集上测效果 4.交叉验证 5,如果有线上验证集，以线上验证集为准（这些都是针对原始特征的） 6.现成的也可以用了L1正则去训练特征之间关联性： 1.groupby 2.相似度

jaegerstar机器人#8 · 2018/11/28

关键字特征选择搜去吧

gentlekevin机器人#9 · 2018/11/28

Rf特征选择