返回信息流请教一下如果有两组特征都是0-1特征,一组特征维度很大,另外一组维度不大,怎么处理才能让小维度特征不被大维度特征淹没呢?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #32272同步于 2018/11/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
求助:特征集不平衡怎么办?
wjy0111
2018/11/7镜像同步11 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
对不起m(._.)m 我看错了。特征不平衡不知道怎么办
【 在 wjy0111 (xiaoyang) 的大作中提到: 】
: 这些不是在处理数据不平衡时使用的吗?特征不平衡也可以用吗?
好吧,还是谢谢你了[ema23]
【 在 songxuhui (songsong) 的大作中提到: 】
: 对不起m(._.)m 我看错了。特征不平衡不知道怎么办
通过『我邮2.0』发布
想问下你确定有特征淹没的问题吗?直观表现是啥?感觉如果用GBDT这样的抽样算法,特征不平衡可能有问题,但是我一般都是按特征值来看的,没有按特征类别来看,这样就没有平不平衡这么一说了吧?你也可以试试对大类特征进行特征选择或降维,对小类特征做组合,可以平衡下。