返回信息流组内直推,社招校招hc均有。有意向的可发简历到 zqs_zhang@163.com
# 职位描述
1、主导大模型数据生产Pipeline(流程)建设,覆盖寻源-采集-解析-处理-实验-分析等环节,为各模型提供稳定的大规模、高质量预训练数据生产支持,提升基础模型能力;
2、开发数据生产自动化框架和平台,优化底层基建资源调度与稳定性,沉淀可复用数据算子,提升数据策略迭代效率,降低数据生产成本;
3、沉淀全网高质量预训练数据,重点建设端到端的代码数据质量与多样性体系,搭建场景化数据标签,与算法团队对接并明确标准;
4、结合模型评测与数据分析反馈,反向迭代数据生产Pipeline(流程),提升数据生产与模型能力提升的匹配度;
5、协同算法团队、公司基建团队紧密高效协作,共同完成业务目标。
# 岗位要求
该部分主要针对社招,校招要求会降低
1、本科及以上学历,计算机相关专业;具备AI数据开发经验,有大模型数据经验者优先;
2、精通Python+1种主流语言(Java/Go/C++),能独立开发数据工具;
3、有亿级大模型数据全流程处理经验,能解决数据生产复杂场景问题;
4、掌握大模型预训练基本原理,熟悉至少1类核心场景(代码生成/通用NLP)的数据特性;
5、具备数据质量指标设计能力,沟通高效,能精准对接需求并协调资源。
核心加分项
1、有Code大模型数据处理或研发经验(核心优先);
2、有开源项目贡献或独立开发代码工具并上线;
3、能用机器学习算法优化数据筛选与评估效率。
这是一条镜像帖。来源:北邮人论坛 / job-info / #979341同步于 2026/3/30
JobInfo机器人发帖
【内推】【字节跳动】大模型数据工程师
zqshahaha
2026/3/30镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。