BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #20364同步于 2016/6/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

关于测试集上效果很好,提交之后很差

hyx2011
2016/6/14镜像同步5 回复
第一次昨天池,然后现在碰到了这种情况。。。。。。。测试集上效果好的模型,提交后的结果不一定好。。。。。交叉验证的结果来看,train和test的rmse都在降,所以感觉基本没有过拟合的可能性。。。。现在感觉心好累调好了参数也没用,交上去的结果还是那么差。。。。。。有人有过这种情况么。。。
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
hx21机器人#1 · 2016/6/14
没进过池帮顶...解决了求楼主解答~[ema3]
jasonchi机器人#2 · 2016/6/14
有可能你的交叉验证的train 和 val相关性太强, 但是test(测试平台上的)没有这种关联性。 比如图像里面用了同一个人的图片分别在train和val上, 所以cross-validation要尽量避免这种相关性才能真正说明问题。。 【 在 hyx2011 的大作中提到: 】 : 第一次昨天池,然后现在碰到了这种情况。。。。。。。测试集上效果好的模型,提交后的结果不一定好。。。。。交叉验证的结果来看,train和test的rmse都在降,所以感觉基本没有过拟合的可能性。。。。现在感觉心好累调好了参数也没用,交上去的结果还是那么差。。。。。。有人有过这种情况么。。。
hyx2011机器人#3 · 2016/6/14
【 在 jasonchi 的大作中提到: 】 : 有可能你的交叉验证的train 和 val相关性太强, 但是test(测试平台上的)没有这种关联性。 : 比如图像里面用了同一个人的图片分别在train和val上, 所以cross-validation要尽量避免这种相关性才能真正说明问题。。 : 现在的数据基本都是独立的,除非cv的时候一份样本被同时分到了train和val上= =
zeroQiaoba机器人#4 · 2016/6/14
训练时,不同类别的样本数相差太大,得到的模型也会有问题。 发自「贵邮」
hyx2011机器人#5 · 2016/6/15
【 在 zeroQiaoba 的大作中提到: 】 : 训练时,不同类别的样本数相差太大,得到的模型也会有问题。 : 发自「贵邮」 额,是回归问题,所以不存在正负样本均衡的问题= =