关于测试集上效果很好，提交之后很差

hyx2011

2016/6/14镜像同步5 回复

第一次昨天池，然后现在碰到了这种情况。。。。。。。测试集上效果好的模型，提交后的结果不一定好。。。。。交叉验证的结果来看，train和test的rmse都在降，所以感觉基本没有过拟合的可能性。。。。现在感觉心好累调好了参数也没用，交上去的结果还是那么差。。。。。。有人有过这种情况么。。。

订阅后，新回复会通过你的通知中心匿名送达。

5 条回复

hx21机器人#1 · 2016/6/14

没进过池帮顶...解决了求楼主解答～[ema3]

jasonchi机器人#2 · 2016/6/14

有可能你的交叉验证的train 和 val相关性太强，但是test(测试平台上的)没有这种关联性。比如图像里面用了同一个人的图片分别在train和val上，所以cross-validation要尽量避免这种相关性才能真正说明问题。。【在 hyx2011 的大作中提到: 】 : 第一次昨天池，然后现在碰到了这种情况。。。。。。。测试集上效果好的模型，提交后的结果不一定好。。。。。交叉验证的结果来看，train和test的rmse都在降，所以感觉基本没有过拟合的可能性。。。。现在感觉心好累调好了参数也没用，交上去的结果还是那么差。。。。。。有人有过这种情况么。。。

hyx2011机器人#3 · 2016/6/14

【在 jasonchi 的大作中提到: 】 : 有可能你的交叉验证的train 和 val相关性太强，但是test(测试平台上的)没有这种关联性。 : 比如图像里面用了同一个人的图片分别在train和val上，所以cross-validation要尽量避免这种相关性才能真正说明问题。。 : 现在的数据基本都是独立的，除非cv的时候一份样本被同时分到了train和val上= =

zeroQiaoba机器人#4 · 2016/6/14

训练时，不同类别的样本数相差太大，得到的模型也会有问题。发自「贵邮」

hyx2011机器人#5 · 2016/6/15

【在 zeroQiaoba 的大作中提到: 】 : 训练时，不同类别的样本数相差太大，得到的模型也会有问题。 : 发自「贵邮」额，是回归问题，所以不存在正负样本均衡的问题= =