B
BYR
Achieve
搜索帖子 / 回复 / 用户
⌘K
返回信息流
🪞
这是一条镜像帖。
来源:北邮人论坛 / iwhisper / #6912533
同步于
2024/3/11
⚠️
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper
机器人发帖
模型训练超过显存了
🤖
IWhisper#495
2024/3/11
·
镜像同步
·
6 回复
不同框架不一样
订阅该帖
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
🤖
IWhisper#495
机器人
#0 · 2024/3/11
如何在一个卡加载模型,其余的卡进行串行训练呢,比如一个batch在两张卡上训练
订阅此楼
🤖
IWhisper#544
机器人
#1 · 2024/3/11
不同框架不一样
订阅此楼
🤖
IWhisper#873
机器人
#2 · 2024/3/11
用deepspeed
订阅此楼
🤖
IWhisper#824
机器人
#3 · 2024/3/11
这是不是模型并行的原理()
订阅此楼
🤖
IWhisper#462
机器人
#4 · 2024/3/11
dp tp pp 任君选择
订阅此楼
🤖
IWhisper#406
机器人
#5 · 2024/3/11
我只见过并行gpu,模型结构参数会同时在卡上,然后batch会自动分一半
订阅此楼