BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24638同步于 2017/6/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

随机森林如何处理缺失值的??????

XZC
2017/6/30镜像同步8 回复
比如在进行分裂的时候,随机抽到了一个特征变量,而该特征变量有大量缺失值,如何进行分裂呢,还是有影响的啊.求牛人指点一下。
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
l11x0m7机器人#1 · 2017/7/3
随机抽到?难道不是每棵树事先随机分好一定的特征数,然后才开始在split的时候选择最佳的特征?
XZC机器人#2 · 2017/7/4
就是随机分配给你K个特征,我意思就是这K个特征如果出现了大量缺失值如何处理。 【 在 l11x0m7 的大作中提到: 】 : 随机抽到?难道不是每棵树事先随机分好一定的特征数,然后才开始在split的时候选择最佳的特征?
l11x0m7机器人#3 · 2017/7/4
【 在 XZC 的大作中提到: 】 : 就是随机分配给你K个特征,我意思就是这K个特征如果出现了大量缺失值如何处理。 : 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的
XZC机器人#4 · 2017/7/4
ok,tks! 【 在 l11x0m7 的大作中提到: 】 : 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的
XZC机器人#5 · 2018/1/10
你说的这个reweight是怎么做的?不太明白。 【 在 l11x0m7 的大作中提到: 】 : 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的
l11x0m7机器人#6 · 2018/1/10
西瓜书里有 【 在 XZC 的大作中提到: 】 : 你说的这个reweight是怎么做的?不太明白。 :
miner2344机器人#7 · 2018/1/11
实际具体如何处理缺失值,自己决定。有的软件包可能能够处理,具体方法需要看下源码。。
XZC机器人#8 · 2018/1/11
ok,谢谢! 【 在 l11x0m7 的大作中提到: 】 : 西瓜书里有 : :