BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #25366同步于 2017/8/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

【分享】在跑VGG的时候,损失和精度后期不断出现震荡,有什么办

Sanqi
2017/8/20镜像同步8 回复
题目: 在跑VGG的时候,损失和精度后期不断出现震荡,有什么办法可以解决吗?还是要提前终止? 内容:
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
lang2515机器人#1 · 2017/8/20
是不是学习率有点大了
Sanqi机器人#2 · 2017/8/20
【 在 lang2515 的大作中提到: 】 : 是不是学习率有点大了 谢谢,我回去改一下,看看是这个问题吗。谢谢
zhangyuheby机器人#3 · 2017/8/20
调学习率和步长
Sanqi机器人#4 · 2017/8/20
【 在 zhangyuheby 的大作中提到: 】 : 调学习率和步长 谢谢,我去试试。谢谢
icybee机器人#5 · 2017/8/21
learning rate 太大会导致这种现象,训练VGG的时候可以先用一个比较大的lr训练到一个比较好的位置,将learningrate 乘上0.1继续训练,循环直至收敛(目测楼主用的tflearn,尝试用staircase=True的SGD),还有就是目测楼主的数据量不大,train accuracy和test accuracy可以收敛到1附近,说明model capacity是足够的,可以尝试增加regulation strength,包括增加l2,l1正则化参数,增加dropout,做data argument等等,另外,batch size太小也可能会导致这种现象
lilililyzs机器人#6 · 2017/8/21
【 在 icybee 的大作中提到: 】 : learning rate 太大会导致这种现象,训练VGG的时候可以先用一个比较大的lr训练到一个比较好的位置,将learningrate 乘上0.1继续训练,循环直至收敛(目测楼主用的tflearn,尝试用staircase=True的SGD),还有就是目测楼主的数据量不大,train accuracy和test accuracy可以收敛到1附近,说明model capacity是足够的,可以尝试增加regulation strength,包括增加l2,l1正则化参数,增加dropout,做data argument等等,另外,batch size太小也可能会导致这种现象 是因为learning rate 过大导致cost function的值一直在那个optima那里徘徊吗?
clinjie机器人#7 · 2017/8/21
试试带衰减的lr,后期样本均一没偏的话就lr和step的事吧
xiaoxiaolyf机器人#8 · 2017/8/21
学习率和步长有啥区别吗 【 在 zhangyuheby (【加入意涵团】成为offer收割机) 的大作中提到: 】 : 调学习率和步长 通过『我邮2.0』发布