返回信息流为什么,cpu上梯度消失了
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #30316同步于 2018/7/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
同样的代码在gpu上效果比cpu好很多
simona081
2018/7/1镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
我意思是你可以在CPU和GPU上设置更小的值再跑,可能差距就没那么大了
【 在 simona081 的大作中提到: 】
: 难道cpu上跑batch应该小一点?
哈哈我有次把gpu训好的模型,放在cpu上跑推断。就是把pytorch里所有的.cuda()改成.cpu(),然后精度从0.98下降到0.978,相当于直接就不能用了
【 在 viredery 的大作中提到: 】
: 哈哈我有次把gpu训好的模型,放在cpu上跑推断。就是把pytorch里所有的.cuda()改成.cpu(),然后精度从0.98下降到0.978,相当于直接就不能用了
对精度要求这么高?
w h y
【 在 viredery 的大作中提到: 】
: 哈哈我有次把gpu训好的模型,放在cpu上跑推断。就是把pytorch里所有的.cuda()改成.cpu(),然后精度从0.98下降到0.978,相当于直接就不能用了