返回信息流有没有大神能讲解一下的,在网上搜了很久都只说用了回归树,而没有说为什么可以用在分类任务里
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #27905同步于 2018/1/12
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
Re: 【分享】XGBoost的基分类器为什么是回归树,回归树得到的结
xyx123
2018/1/12镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
boosting算法中,每一次是对损失函数的导数做近似。导数是一个实数,自然是用回归树。如果乡知道为什么,要去看作者的论文,或者elements of statistical learning里面关于boosting的介绍。
建议还是看看xgboost的论文XGBoost: A Scalable Tree Boosting System,里面有详细的理论推导,相信你会有新的认识和收获的
因为gbdt/xgb 是作用在函数空间的,每一棵数拟合的是当前状态的残差,gradient boost是说对加性模型求梯度来进行梯度下降优化损失函数,分类树没办法表示成 y=f(x) 这种能用来求梯度(xgb 是用牛顿法),所以需要转为回归树,可以去看看gbdt 的paper