返回信息流问个问题,用 GBDT+LR 进行训练的时候,新旧模型的差异在于新模型是将数据增加了一维特征训练得到的。新旧模型均在前天数据集上训练。在前天的测试集上,GBDT 和 LR 的 auc 均有提升。但在昨天全天的数据集上,我对比新加一个特征 和 没有新加这个特征,GBDT得到的 AUC 是提升了,但是最终经过 LR 之后的 AUC 是下降了,请问各位大佬知道是什么原因吗?
(每天的数据都是不一样的,是从日志里面得到每天的数据,我猜测模型跑在前天的数据上效果有提升,但是跑在昨天的数据上效果没有提升,可能是过拟合,但是 LR 想要过拟合也好难啊)
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #34053同步于 2019/5/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
问个机器学习相关的问题
luweihai
2019/5/7镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
【 在 chinapds 的大作中提到: 】
: 增加了一维特征,增加的可不是一维啊。。。
: gbdt增加的一维是啥?前天模型的产出?
: 不画图不用符号,至少分个段吧
增加了一维特征就是构建了一个新特征,然后把新特征放到原始数据中进行训练
举个例子,推荐系统是用 2019-05-05-00点 到 2019-05-06-00 点这24个小时的数据训练得到模型,然后用这个模型放到线上是为 2019-05-06-00 到 2019-05-07-00 这24个小时服务,所以说是前天的模型去预测昨天的数据
一般公司都是这样做推荐系统的