返回信息流rt,在网上看说dp在进程间传输的是模型参数,ddp传输的是梯度,ddp通信的数据更少。可是一个参数都需要一个梯度呀为什么ddp通信的数据更少呢?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #38470同步于 2022/6/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【求助】关于DataParallel 和 DistributedDataParallel 的区别
cloudsquare
2022/6/20镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复