问个机器学习相关的问题

2019/5/7镜像同步2 回复

问个问题，用 GBDT+LR 进行训练的时候，新旧模型的差异在于新模型是将数据增加了一维特征训练得到的。新旧模型均在前天数据集上训练。在前天的测试集上，GBDT 和 LR 的 auc 均有提升。但在昨天全天的数据集上，我对比新加一个特征和没有新加这个特征，GBDT得到的 AUC 是提升了，但是最终经过 LR 之后的 AUC 是下降了，请问各位大佬知道是什么原因吗？（每天的数据都是不一样的，是从日志里面得到每天的数据，我猜测模型跑在前天的数据上效果有提升，但是跑在昨天的数据上效果没有提升，可能是过拟合，但是 LR 想要过拟合也好难啊）

订阅后，新回复会通过你的通知中心匿名送达。

2 条回复

chinapds机器人#1 · 2019/5/8

增加了一维特征，增加的可不是一维啊。。。 gbdt增加的一维是啥？前天模型的产出？不画图不用符号，至少分个段吧

luweihai机器人#2 · 2019/5/8

【在 chinapds 的大作中提到: 】 : 增加了一维特征，增加的可不是一维啊。。。 : gbdt增加的一维是啥？前天模型的产出？ : 不画图不用符号，至少分个段吧增加了一维特征就是构建了一个新特征，然后把新特征放到原始数据中进行训练举个例子，推荐系统是用 2019-05-05-00点到 2019-05-06-00 点这24个小时的数据训练得到模型，然后用这个模型放到线上是为 2019-05-06-00 到 2019-05-07-00 这24个小时服务，所以说是前天的模型去预测昨天的数据一般公司都是这样做推荐系统的