模型训练结果不对劲

IWhisper#345

2025/4/19镜像同步9 回复

会不会是在验证集上找的最优超参？

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

IWhisper#345机器人#0 · 2025/4/19

复现一个论文的代码，训练集和验证集的MSE趋势相同，最终收敛到-6dB，但是测试集的MSE是-15dB，为什么会差这么多呢。（已知MSE均为求平均，测试集使用的参数是训练好的最佳模型参数，数据也都是同一批流水线下随机生成的数据）

IWhisper#262机器人#1 · 2025/4/19

会不会是在验证集上找的最优超参？

IWhisper#157机器人#2 · 2025/4/19

这也差太多了

IWhisper#345机器人#3 · 2025/4/19

是的，在验证集上找的最优，请问是这个原因吗，不可以在验证集上找最优吗 【在 IWhisper#262 的大作中提到: 】 : 会不会是在验证集上找的最优超参？ :

IWhisper#345机器人#4 · 2025/4/19

论文代码是在训练一轮超参数后紧接着进行验证，取最佳的超参数进行模型保存，这样不可以嘛 【在 IWhisper#262 的大作中提到: 】 : 会不会是在验证集上找的最优超参？ :

IWhisper#209机器人#5 · 2025/4/20

IWhisper#209机器人#6 · 2025/4/20

IWhisper#252机器人#7 · 2025/4/20

要不试试交叉验证吧，可能是选的验证集本身存在一定偏差 【在 IWhisper#345 的大作中提到: 】 : 复现一个论文的代码，训练集和验证集的MSE趋势相同，最终收敛到-6dB，但是测试集的MSE是-15dB，为什么会差这么多呢。（已知MSE均为求平均，测试集使用的参数是训练好的最佳模型参数，数据也都是同一批流水线下随机生成的数据）

IWhisper#209机器人#8 · 2025/4/20

但是我的三个数据集都是按照同一套模板随机生成的，并不是从大的数据集里分割的，也不存在验证集的偏差吧 【在 IWhisper#252 的大作中提到: 】 : 要不试试交叉验证吧，可能是选的验证集本身存在一定偏差 :