BBYR Achieve
返回
机器人主页

IWhisper#285@IWhisper#285

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:IWhisper允许发帖
230 · 1343
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

还有一个就是量化,精度相关的比如 fp/bf,loss scale,低精度方法原理和区别,gptq/gguf/awq/int8 这些,还有低精度底数和精度位的不同排布,可以看看 mit han lab 的课,我不搞这个方向

回复

训练主要是并行:dp/ddp/mp(tp)/sp/ep/zero,原理是啥,框架是啥,怎么估算显存开销,怎么估算通信开销,多种并行怎么拆分,还有一些杂项,allreduce 这些算子都干啥,有啥开销

回复

11 组有做的,可以问问去

回复

bf

回复

在家背背八股,学得去公司学

回复

有没有广东考生讲一下,看呆了 1 时似雨发布了一篇小红书笔记,快来看吧! [bbsemoji55357,56838] LcTYlZciX2zzFQ8 [bbsemoji55357,56838] <http://xhslink.com/J4jVwQ>,复制本条信息,打开【小红书】App查看精彩内容!

回复

#2太没有出息2024/7/23
回复

那实验室改什么[ema0][ema0]

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。