返回信息流最近在训练一个CNN模型,算是复现git上的一个源代码,简单来说就是计算一张图片中的人数,用作者提供的数据集训练效果很好,预测值比较接近真实值,大体上是可靠的;
但是用自己的数据集进行训练(训练参数和配置文件基本上没有改动,只改变了数据集),得到的预测值基本上没有大的波动,与真实值之间还相差太多,就连处理单张图片所用的时间也比作者demo长了很多;
现在我的疑问是:出现这种问题,是我训练模型的过程不对(比如参数等问题),还是作者的这种网络根本不适合我的数据集???
问题可能描述不够清楚,还请大神给予指导
[ema23][ema23][ema23]
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #26401同步于 2017/10/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【问题】【求大神指导】CNN模型训练
iLuffy
2017/10/20镜像同步18 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
【 在 dacong001 的大作中提到: 】
: 你倒是给个github的地址啊,鬼知道人家怎么做的,不是么
https://github.com/gramuah/ccnn 呐
1 你的数据集和作者的数据集数量上差了多少? 有没有具体看过两个数据集有什么区别? 标注对不对?
2 你的训练进行了多少轮? 作者训练了多少轮?
3 对于处理时间,是不是和输入图片尺寸有关? 处理时间变长,具体长了多少?
【 在 moonfighting 的大作中提到: 】
: 1 你的数据集和作者的数据集数量上差了多少? 有没有具体看过两个数据集有什么区别? 标注对不对?
: 2 你的训练进行了多少轮? 作者训练了多少轮?
: 3 对于处理时间,是不是和输入图片尺寸有关? 处理时间变长,具体长了多少?
1 作者给了一个读者可以自己训练的脚本,我看到这个训练样本只有160张(也可能因为这个数据集比较简单,而且图片尺寸也小,所以训练样本比较小),我跑了一下用这些照片训练的模型,再去预测同数据集的其他图片,效果还是很好的;我用自己的数据集跑模型训练最多的时候只放了400来张(嗯,但前面的大神说400太少了,远远不够),当然我的数据就远远没有公开数据集的质量好了,不光阴影比较多,而且不光有行人,车流量也有;至于标注的话,我觉得这方面应该没有问题
2 我看作者的max_iter设为50000,我也设置了一样的
3 处理时间长这个问题,我觉得可能和图片尺寸是有关系,我的图片尺寸比较大,但用了GPU处理,竟然还需要四五分钟来处理单张图片,我觉得还是挺不可思议的
嗯,暂时就这样了,特别感谢你的提问
【 在 miner2344 的大作中提到: 】
: 搞不懂啥意思,预测值没有大的波动,是训练阶段还是测试阶段。你的问题是没有拟合还是怎么
感觉像是没有拟合[em73]
没有拟合的话,就是检查数据质量,加深模型复杂度。不过看你说数据集只有400,,还是先想着怎么多一点数据,图片的话自己生成一些?
【 在 iLuffy (草帽小子) 的大作中提到: 】
: 感觉像是没有拟合[em73]
【 在 miner2344 的大作中提到: 】
: 没有拟合的话,就是检查数据质量,加深模型复杂度。不过看你说数据集只有400,,还是先想着怎么多一点数据,图片的话自己生成一些?
一般训练样本是不是都成千上万了