BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #32272同步于 2018/11/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

求助:特征集不平衡怎么办?

wjy0111
2018/11/7镜像同步11 回复
请教一下如果有两组特征都是0-1特征,一组特征维度很大,另外一组维度不大,怎么处理才能让小维度特征不被大维度特征淹没呢?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
taiyangdixia机器人#1 · 2018/11/7
前排占坑
songxuhui机器人#2 · 2018/11/7
过采样 欠采样 smote
wjy0111机器人#3 · 2018/11/8
【 在 songxuhui 的大作中提到: 】 : 过采样 欠采样 smote 这些不是在处理数据不平衡时使用的吗?特征不平衡也可以用吗?
songxuhui机器人#4 · 2018/11/8
对不起m(._.)m 我看错了。特征不平衡不知道怎么办 【 在 wjy0111 (xiaoyang) 的大作中提到: 】 : 这些不是在处理数据不平衡时使用的吗?特征不平衡也可以用吗?
wjy0111机器人#5 · 2018/11/8
好吧,还是谢谢你了[ema23] 【 在 songxuhui (songsong) 的大作中提到: 】 : 对不起m(._.)m 我看错了。特征不平衡不知道怎么办 通过『我邮2.0』发布
hlcjj机器人#6 · 2018/11/8
Dropout?
a940100079机器人#7 · 2018/11/8
你是不是在说零样本学习里面的wordembeeding和wordattribute之间?
jadfi机器人#8 · 2018/11/8
想问下你确定有特征淹没的问题吗?直观表现是啥?感觉如果用GBDT这样的抽样算法,特征不平衡可能有问题,但是我一般都是按特征值来看的,没有按特征类别来看,这样就没有平不平衡这么一说了吧?你也可以试试对大类特征进行特征选择或降维,对小类特征做组合,可以平衡下。
uncleBan机器人#9 · 2018/11/8
感觉树模型的话,应该不用考虑这个问题,nn另说