返回信息流会不会是在验证集上找的最优超参?
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8238055同步于 2025/4/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
模型训练结果不对劲
IWhisper#345
2025/4/19镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
复现一个论文的代码,训练集和验证集的MSE趋势相同,最终收敛到-6dB,但是测试集的MSE是-15dB,为什么会差这么多呢。(已知MSE均为求平均,测试集使用的参数是训练好的最佳模型参数,数据也都是同一批流水线下随机生成的数据)
是的,在验证集上找的最优,请问是这个原因吗,不可以在验证集上找最优吗<br>【 在 IWhisper#262 的大作中提到: 】<br><font class="f006">: 会不会是在验证集上找的最优超参? </font><br>:
论文代码是在训练一轮超参数后紧接着进行验证,取最佳的超参数进行模型保存,这样不可以嘛<br>【 在 IWhisper#262 的大作中提到: 】<br><font class="f006">: 会不会是在验证集上找的最优超参? </font><br>:
要不试试交叉验证吧,可能是选的验证集本身存在一定偏差<br>【 在 IWhisper#345 的大作中提到: 】<br><font class="f006">: 复现一个论文的代码,训练集和验证集的MSE趋势相同,最终收敛到-6dB,但是测试集的MSE是-15dB,为什么会差这么多呢。(已知MSE均为求平均,测试集使用的参数是训练好的最佳模型参数,数据也都是同一批流水线下随机生成的数据) </font>
但是我的三个数据集都是按照同一套模板随机生成的,并不是从大的数据集里分割的,也不存在验证集的偏差吧<br>【 在 IWhisper#252 的大作中提到: 】<br><font class="f006">: 要不试试交叉验证吧,可能是选的验证集本身存在一定偏差 </font><br>: