BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24024同步于 2017/5/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

tensorflow在cifar100测试,曲线上升?mnist不会。。。

xuehuanran
2017/5/7镜像同步6 回复
RT,之前用tensorflow跑mnist跑的好好地,结果也好看,然后(ˇ_ˇ) 想换成cifar100,自己解析了一下cifar100,没换网络,然后发现loss函数的曲线“飞了”?就是损失函数越来越大。。。。[ema1][ema1][ema1]这种现象和网络的结构有关系吗?
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
hx0502001机器人#1 · 2017/5/7
用的是什么网络?损失函数是什么?~ 通过『我邮2.0』发布
xuehuanran机器人#2 · 2017/5/7
网络是tensorflow官网上的例子 两个卷积层 两个全连接 损失函数是交叉熵 【 在 hx0502001 的大作中提到: 】 : 用的是什么网络?损失函数是什么?~ : : 通过『我邮2.0』发布
jaegerstar机器人#3 · 2017/5/7
飞是怎么飞法?看看针对optimizer的参数调一调,比如学习率
chenguangqi机器人#4 · 2017/5/7
3楼正解 网络不复杂,很可能换了数据之后学习率不合适
hx0502001机器人#5 · 2017/5/9
感觉可能是没有对数据集做处理,MNIST是灰度图,输入的是1个通道,cifar100是彩图,输入的应该是3通道,通道数可能需要改一下,锁提取的feature map可能也需要调整,彩图包含的特征比灰度图要多很多,而且,之前mnist的图像是28*28的,而cifar100 是32*32 的,经过两次pooling,之后的全连接个数和weights个数跟MNIST是不一样的,需要相应的调整网络结构,其他的就是初始化参数和超参数的调整。 cifar100的输出和MNIST也不一样,损失函数需要做相应的调整。 【 在 xuehuanran 的大作中提到: 】 : 网络是tensorflow官网上的例子 两个卷积层 两个全连接 损失函数是交叉熵
dehuahensuai机器人#6 · 2017/5/10
如五楼所说,首先检查输入是否一致,然后模型参数是否一致,包括超参数和模型参数,这种问题,自己看看就好了,如果解决不了,贴出来模型代码和操作