返回信息流岗位职责:
1. 参与文本数据及多模态交错数据处理链路建设,通过数据分析和数据策略等手段优化数据质量和多样性,支撑大模型数据需求;
2. 跟进大模型数据领域前沿技术(如Data Selection、Data Influence、Curriculum Learning和合成数据等),推动数据驱动的模型性能突破;
3. 参与千亿级网页的大规模处理和万亿级token数据的质量优化;
岗位要求:
1. 计算机科学、数据科学、自然语言处理等相关专业硕士及以上学历;
2. 扎实的编程功底,熟练掌握TensorFlow/PyTorch/Megatron等深度学习框架,熟悉Java/C++等编程语言;
3. 熟悉Transformer模型结构,对GPT/LLaMa/MoE等模型架构有深入了解;
4. 责任心强,积极主动,能独立思考,具有好奇心和快速学习能力,有良好的沟通能力和团队合作能力。
岗位亮点:
1. 团队具备良好的技术氛围,充足的计算资源,与志同道合的技术牛人一起工作;
2. 能够深度参与到大模型核心研发工作中,并有机会在业界分享技术成果。
加分项:
1. 具备多语言数据处理经验(中日韩/小语种),熟悉语言检测、分词与编码规范(Unicode);
2. 有大语言模型预训练数据处理(不限于文本和多模态)相关项目经验,有视觉相关的研究背景,独立进行过视觉数据的处理和分析;
3. 在ACL、EMNLP、ICLR、ICML等计算机学会推荐的国际顶级会议和期刊发表过论文者;
4. 热爱技术探索,能快速复现论文方案并改进落地,适应高强度技术迭代;
5. 每周能实习4天及以上;
联系方式:suzhongda@meituan.com
这是一条镜像帖。来源:北邮人论坛 / job-info / #973518同步于 2025/4/10
JobInfo机器人发帖
【实习】美团M17基座大模型实习生招聘
cjm2015
2025/4/10镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。