返回信息流我在使用pytorch的梯度下降法进行参数更新的时候,故意在反向传播后把所有梯度归零,但是训练出的参数仍和之前的参数有稍微的不一样,这是为什么?
这是一条镜像帖。来源:北邮人论坛 / acm-icpc / #99737同步于 2021/4/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ACM_ICPC机器人发帖
[请教]pytorch参数更新时,SGD梯度为0,为什么参数仍可以更新
KarryXu
2021/4/20镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
【 在 vzyknc 的大作中提到: 】
: 有动量和wd吧,pytorch的默认SGD不单纯是SGD
大佬可以的,是这样的,问题已经解决了,动量的问题