返回信息流不太能,有论文有实习都乱杀不了。今年卷得一
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7725906同步于 2024/10/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
大模型只靠实习可以乱杀吗
IWhisper#734
2024/10/22镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
10 条回复
特别卷,纯大模型研究岗够呛,跟业务结合有机会。<br>举个例子来说,你说的大模型岗,大模型大模型,最起码模型得大,比如说你有多少张卡给你训练,百卡嘛?几B量级的,5B以上嘛?多少数据量,有E级嘛?<br>问下自己的大模型实习岗位能否达到,如果只是微调,或者处理数据,这个的话可能就竞争力不如顶会。<br>怎么说呢,不管大模型还是啥,都是对口顶会大于对口实习大于顶会大于实习。<br>说的再通俗一点,顶会,实习都是考察你能力的纬度,实习的含金量大于顶会就没问题。只是现在人家发顶会的同学也不傻,也开始卷实习,所以就比较难了。<br>但是业务算法岗还是没有问题的,毕竟百分之九十都是业务算法。
看了半年大模型的顶会论文和目前国内技术的研究现状和场景,我个人感觉这个方向下一步的提升还是服务于项目的,不仅仅是模型微调这么简单,而是像搭积木一样,用最简单的预训练模型实现最复杂的功能,你像一个月前字节联合清华发布的新框架,就是两年前简单迭代,技术力也不高,但确实创新了一点点场景
借楼问,相较于纯大模型研究岗,大模型推理加速门槛怎么样,也需要对口顶会吗<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br>【 在 IWhisper#295 的大作中提到: 】<br><font class="f006">: 特别卷,纯大模型研究岗够呛,跟业务结合有机会。 </font><br><font class="f006">: 举个例子来说,你说的大模型岗,大模型大模型,最起码模型得大,比如说你有多少张卡给你训练,百卡嘛?几B量级的,5B以上嘛?多少数据量,有E级嘛? </font><br><font class="f006">: 问下自己的大模型实习岗位能否达到,如果只是微调,或者处理数据,这个的话可能就竞争力不如顶会。 </font><br><font class="f006">: 怎么说呢,不管大模型还是啥,都是对口顶会大于对口实习大于顶会大于实习。 </font><br><font class="f006">: ............ </font>
这个不太了解,我这边偏预训练和微调。<br>感觉你可以试试,我感觉这个比较硬核,手写cuda算子啥的。以我现在的观感来看,感觉不像预训练微调那么多。毕竟我也没做过,看看有没有其他大佬补充。<br>【 在 IWhisper#617 的大作中提到: 】<br><font class="f006">: 借楼问,相较于纯大模型研究岗,大模型推理加速门槛怎么样,也需要对口顶会吗<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"> </font>
Bd<br>【 在 IWhisper#617 的大作中提到: 】<br><font class="f006">: 借楼问,相较于纯大模型研究岗,大模型推理加速门槛怎么样,也需要对口顶会吗<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"> </font>