返回信息流也就是为啥xgboost要二阶泰勒展开,为了和后边的正则项凑?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #29562同步于 2018/5/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
哪位大佬能帮忙分析一下,xgboost用了二阶导数相比GBDT一阶导数
stArrr
2018/5/16镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
xgboost vs gbdt 可以类比于牛顿法vs梯度下降。 前者都用了first order+second order 的信息,后者只用了 first order,所以xgboost和牛顿法都能更快的收敛
就是不仅利用了速度信息,还利用了加速度信息?
【 在 BruceWayne94 (Deng) 的大作中提到: 】
: xgboost vs gbdt 可以类比于牛顿法vs梯度下降。 前者都用了first order+second order 的信息,后者只用了 first order,所以xgboost和牛顿法都能更快的收敛