返回信息流比如在进行分裂的时候,随机抽到了一个特征变量,而该特征变量有大量缺失值,如何进行分裂呢,还是有影响的啊.求牛人指点一下。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24638同步于 2017/6/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
随机森林如何处理缺失值的??????
XZC
2017/6/30镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
就是随机分配给你K个特征,我意思就是这K个特征如果出现了大量缺失值如何处理。
【 在 l11x0m7 的大作中提到: 】
: 随机抽到?难道不是每棵树事先随机分好一定的特征数,然后才开始在split的时候选择最佳的特征?
【 在 XZC 的大作中提到: 】
: 就是随机分配给你K个特征,我意思就是这K个特征如果出现了大量缺失值如何处理。
:
可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的
ok,tks!
【 在 l11x0m7 的大作中提到: 】
: 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的
你说的这个reweight是怎么做的?不太明白。
【 在 l11x0m7 的大作中提到: 】
: 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的