返回信息流题目:
在跑VGG的时候,损失和精度后期不断出现震荡,有什么办法可以解决吗?还是要提前终止?
内容:
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #25366同步于 2017/8/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【分享】在跑VGG的时候,损失和精度后期不断出现震荡,有什么办
Sanqi
2017/8/20镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
learning rate 太大会导致这种现象,训练VGG的时候可以先用一个比较大的lr训练到一个比较好的位置,将learningrate 乘上0.1继续训练,循环直至收敛(目测楼主用的tflearn,尝试用staircase=True的SGD),还有就是目测楼主的数据量不大,train accuracy和test accuracy可以收敛到1附近,说明model capacity是足够的,可以尝试增加regulation strength,包括增加l2,l1正则化参数,增加dropout,做data argument等等,另外,batch size太小也可能会导致这种现象
【 在 icybee 的大作中提到: 】
: learning rate 太大会导致这种现象,训练VGG的时候可以先用一个比较大的lr训练到一个比较好的位置,将learningrate 乘上0.1继续训练,循环直至收敛(目测楼主用的tflearn,尝试用staircase=True的SGD),还有就是目测楼主的数据量不大,train accuracy和test accuracy可以收敛到1附近,说明model capacity是足够的,可以尝试增加regulation strength,包括增加l2,l1正则化参数,增加dropout,做data argument等等,另外,batch size太小也可能会导致这种现象
是因为learning rate 过大导致cost function的值一直在那个optima那里徘徊吗?
学习率和步长有啥区别吗
【 在 zhangyuheby (【加入意涵团】成为offer收割机) 的大作中提到: 】
: 调学习率和步长
通过『我邮2.0』发布