【问题】【求大神指导】CNN模型训练

2017/10/20镜像同步18 回复

最近在训练一个CNN模型，算是复现git上的一个源代码，简单来说就是计算一张图片中的人数，用作者提供的数据集训练效果很好，预测值比较接近真实值，大体上是可靠的；但是用自己的数据集进行训练（训练参数和配置文件基本上没有改动，只改变了数据集），得到的预测值基本上没有大的波动，与真实值之间还相差太多，就连处理单张图片所用的时间也比作者demo长了很多；现在我的疑问是：出现这种问题，是我训练模型的过程不对（比如参数等问题），还是作者的这种网络根本不适合我的数据集？？？问题可能描述不够清楚，还请大神给予指导 [ema23][ema23][ema23]

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

lizhe123456机器人#1 · 2017/10/20

dacong001机器人#2 · 2017/10/20

你倒是给个github的地址啊，鬼知道人家怎么做的，不是么[ema1]

iLuffy机器人#3 · 2017/10/20

【在 dacong001 的大作中提到: 】 : 你倒是给个github的地址啊，鬼知道人家怎么做的，不是么 https://github.com/gramuah/ccnn 呐

miner2344机器人#4 · 2017/10/20

搞不懂啥意思，预测值没有大的波动，是训练阶段还是测试阶段。你的问题是没有拟合还是怎么

moonfighting机器人#5 · 2017/10/20

1 你的数据集和作者的数据集数量上差了多少？有没有具体看过两个数据集有什么区别？标注对不对？ 2 你的训练进行了多少轮？作者训练了多少轮？ 3 对于处理时间，是不是和输入图片尺寸有关？处理时间变长，具体长了多少？

iLuffy机器人#6 · 2017/10/20

【在 moonfighting 的大作中提到: 】 : 1 你的数据集和作者的数据集数量上差了多少？有没有具体看过两个数据集有什么区别？标注对不对？ : 2 你的训练进行了多少轮？作者训练了多少轮？ : 3 对于处理时间，是不是和输入图片尺寸有关？处理时间变长，具体长了多少？ 1 作者给了一个读者可以自己训练的脚本，我看到这个训练样本只有160张(也可能因为这个数据集比较简单，而且图片尺寸也小，所以训练样本比较小)，我跑了一下用这些照片训练的模型，再去预测同数据集的其他图片，效果还是很好的；我用自己的数据集跑模型训练最多的时候只放了400来张(嗯，但前面的大神说400太少了，远远不够)，当然我的数据就远远没有公开数据集的质量好了，不光阴影比较多，而且不光有行人，车流量也有；至于标注的话，我觉得这方面应该没有问题 2 我看作者的max_iter设为50000，我也设置了一样的 3 处理时间长这个问题，我觉得可能和图片尺寸是有关系，我的图片尺寸比较大，但用了GPU处理，竟然还需要四五分钟来处理单张图片，我觉得还是挺不可思议的嗯，暂时就这样了，特别感谢你的提问

iLuffy机器人#7 · 2017/10/20

【在 miner2344 的大作中提到: 】 : 搞不懂啥意思，预测值没有大的波动，是训练阶段还是测试阶段。你的问题是没有拟合还是怎么感觉像是没有拟合[em73]

miner2344机器人#8 · 2017/10/20

没有拟合的话，就是检查数据质量，加深模型复杂度。不过看你说数据集只有400，，还是先想着怎么多一点数据，图片的话自己生成一些？【在 iLuffy (草帽小子) 的大作中提到: 】 : 感觉像是没有拟合[em73]

iLuffy机器人#9 · 2017/10/21

【在 miner2344 的大作中提到: 】 : 没有拟合的话，就是检查数据质量，加深模型复杂度。不过看你说数据集只有400，，还是先想着怎么多一点数据，图片的话自己生成一些？一般训练样本是不是都成千上万了