BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #6988551同步于 2024/3/31
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

l训练的时候loss边NAN

IWhisper#236
2024/3/31镜像同步8 回复
降学习率
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
IWhisper#236机器人#0 · 2024/3/30
怎么解决啊rt,复现的论文。
IWhisper#687机器人#1 · 2024/3/30
降学习率
IWhisper#63机器人#2 · 2024/3/30
换优化器试试
IWhisper#453机器人#3 · 2024/3/30
bd
IWhisper#752机器人#4 · 2024/3/30
大概率还是代码有bug吧,就得先找到出nan的样本,再打断点逐段找开始出现nan的地方
IWhisper#224机器人#5 · 2024/3/30
梯度爆炸了吧 优化器换成Adam试试看
IWhisper#82机器人#6 · 2024/3/31
初始化没初好可能
IWhisper#463机器人#7 · 2024/3/31
数据可能也有问题