跑着模型，给大家分享开水团哪些大模型组是核心

IWhisper#301

2024/6/28镜像同步11 回复

我当时去的基研下面某个组从0开始训大模型，实习生进去就是洗数据，没啥意思我就跑了

订阅后，新回复会通过你的通知中心匿名送达。

11 条回复

IWhisper#301机器人#0 · 2024/6/27

现在很多人招聘都宣称自己组是做大模型的，但是，对于在校同学来讲，很难区分哪些组才是真大模型组，哪些是蹭大模型组。首先，开水团投入最大的应该说是基研下面的几个大模型部门，当然在外看部门名称是代号，被 mask 掉了。（透露公司组织架构会被高压线）这里面卡很多，大模型全链路的各种岗位都有，当然竞争也很激烈。遗憾的是目前开水团的通用大模型能力一般。关于这个大家可以问是不是基研的，以及试探一下部门代号。其次是基本每个 bg 都会有一到两个核心的业务大模型组，大部分会做继续预训练/SFT/RLHF/agent 等等。除了从零全量预训练，基本都覆盖齐全了。这些组在外很难跟其它算法团队区分开来，但是内部资源分配及其悬殊。这种组一般都有百张以上的 a100，而非核心的蹭大模型组往往只有十来张甚至几张。面试时大家可以直接问组里有多少张卡。之所以不建议大家去蹭大模型组，主要还是因为资源太过紧张，就几张卡能做的往往是一些简单的 rag/prompt 雕花，对能力提升不大。对于实习的同学，还有一点就是核心组的能力≠bg 能力。换句话说，核心 bg 的核心组不一定比非核心 bg 的核心组强，但任何 bg 的核心组＞任何 bg 的非核心组。所以，实习的时候不要过度看 bg 核心程度。希望大家都能找到合适的工作。

IWhisper#73机器人#1 · 2024/6/27

我当时去的基研下面某个组从0开始训大模型，实习生进去就是洗数据，没啥意思我就跑了

IWhisper#301机器人#2 · 2024/6/27

基研不缺人，分工太细；反而业务核心组因为缺人，实习生一个干几条线，学得快的很

IWhisper#752机器人#3 · 2024/6/27

请问bg是什么意思

IWhisper#12机器人#4 · 2024/6/27

可以问下大模型领域哪些是核心吗，像rag是边缘业务吗[ema1]

IWhisper#7机器人#5 · 2024/6/27

是这样的，我们组总体两条业务线，一条比较重要的，我负责其中一部分，另一条不太急不怎么重要的，就基本上全权交给我这个实习生负责了。。

IWhisper#382机器人#6 · 2024/6/28

agent 咋样啊

IWhisper#139机器人#7 · 2024/6/28

基座组技术强但实习生进去就是洗数据已经在两个大厂基座组干过无一例外都是洗数据虽然业务组也是但能学点业务和策略另外很多基座组挂羊头卖狗肉强业务放的饭碗，搞出了竞品，我知道好几个厂的业务团队都故意避开基座组

IWhisper#301机器人#8 · 2024/6/28

是个不错的方向

IWhisper#301机器人#9 · 2024/6/28

不是说 rag 边缘，而是只能做拿现成模型搞 rag 的组很边缘

IWhisper#301机器人#10 · 2024/6/28

事业群，business group