返回信息流第一次昨天池,然后现在碰到了这种情况。。。。。。。测试集上效果好的模型,提交后的结果不一定好。。。。。交叉验证的结果来看,train和test的rmse都在降,所以感觉基本没有过拟合的可能性。。。。现在感觉心好累调好了参数也没用,交上去的结果还是那么差。。。。。。有人有过这种情况么。。。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #20364同步于 2016/6/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
关于测试集上效果很好,提交之后很差
hyx2011
2016/6/14镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
有可能你的交叉验证的train 和 val相关性太强, 但是test(测试平台上的)没有这种关联性。
比如图像里面用了同一个人的图片分别在train和val上, 所以cross-validation要尽量避免这种相关性才能真正说明问题。。
【 在 hyx2011 的大作中提到: 】
: 第一次昨天池,然后现在碰到了这种情况。。。。。。。测试集上效果好的模型,提交后的结果不一定好。。。。。交叉验证的结果来看,train和test的rmse都在降,所以感觉基本没有过拟合的可能性。。。。现在感觉心好累调好了参数也没用,交上去的结果还是那么差。。。。。。有人有过这种情况么。。。
【 在 jasonchi 的大作中提到: 】
: 有可能你的交叉验证的train 和 val相关性太强, 但是test(测试平台上的)没有这种关联性。
: 比如图像里面用了同一个人的图片分别在train和val上, 所以cross-validation要尽量避免这种相关性才能真正说明问题。。
:
现在的数据基本都是独立的,除非cv的时候一份样本被同时分到了train和val上= =
【 在 zeroQiaoba 的大作中提到: 】
: 训练时,不同类别的样本数相差太大,得到的模型也会有问题。
: 发自「贵邮」
额,是回归问题,所以不存在正负样本均衡的问题= =