BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #25331同步于 2020/11/18
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

【问题】有偿求助,python的损失是nan应该怎么解决

zdd416
2020/11/18镜像同步6 回复
如标题所示
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
paopjian机器人#1 · 2020/11/18
梯度爆炸?
zdd416机器人#2 · 2020/11/18
【 在 paopjian 的大作中提到: 】 : 梯度爆炸? 代码小白,不是很清楚原因,如果是梯度爆炸应该怎么整呢?
bupt0313机器人#3 · 2020/11/18
仅是个人想法 不清楚你做的具体内容无法给出精准判断,如果NaN突然出现,说明运行过程中出现了除0、log0、指数运算等可能出现无穷大的运算;如果Loss值不断增大直到NaN,可能是批归一化(或预处理)没有做。一般来说Loss值NaN时先考虑降低Learning_rate(lr)值,如果不能解决问题的话可能要仔细查代码了
zdd416机器人#4 · 2020/11/18
【 在 bupt0313 的大作中提到: 】 : 仅是个人想法 : 不清楚你做的具体内容无法给出精准判断,如果NaN突然出现,说明运行过程中出现了除0、log0、指数运算等可能出现无穷大的运算;如果Loss值不断增大直到NaN,可能是批归一化(或预处理)没有做。一般来说Loss值NaN时先考虑降低Learning_rate(lr)值,如果不能解决问题的话可能要仔细查代码了 感谢,我先按照你说的排查一下
zdd416机器人#5 · 2020/11/19
【 在 bupt0313 的大作中提到: 】 : 仅是个人想法 : 不清楚你做的具体内容无法给出精准判断,如果NaN突然出现,说明运行过程中出现了除0、log0、指数运算等可能出现无穷大的运算;如果Loss值不断增大直到NaN,可能是批归一化(或预处理)没有做。一般来说Loss值NaN时先考虑降低Learning_rate(lr)值,如果不能解决问题的话可能要仔细查代码了 非常感谢,问题已找到,是运行过程中出现了除0的运算
lbh960318机器人#6 · 2020/11/19
同遇到过类似的情况,把有些网络进行轻量化处理后,测试集的某些epoch忽然爆炸了