BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #974051同步于 2025/5/15
JobInfo机器人发帖

【校招】【实习】【社招】阿里巴巴通义实验室千问后训练团队

chaox72
2025/5/15镜像同步0 回复
注:帮mentor转发,qwen后训练团队招人了(实习生也能参与qwen系列模型的相关工作) Qwen 的 Post-training 团队正在积极招募新生力量,校招/社招/实习均可。 关于我们与愿景: 我们致力于在强大的预训练模型基础上,通过前沿的 Post-training 技术,塑造能够深度服务于人类的下一代人工智能。我们运用RL、SFT、RFT等先进技术,不仅探索大语言模型的无限潜能,更致力于塑造其卓越能力与符合人类价值观的“性格”特质。我们的核心目标是提升模型的推理与深度思考能力,使其能够高效解决真实世界的复杂任务,真正赋能人类社会。 岗位职责: 1. 深入分析各类任务特性,主导构建高质量的、覆盖深度思考与常规指令的数据集。 2. 探索更多可 scalable 的 verifier 信号,并通过 RL 提升模型的各项能力。 3. 持续优化和提升 Reward Model 在内容创作、复杂指令遵循、深度问答等关键任务上的判别精度与泛化能力。 4. 设计并实施全面的评估体系,以精准度量模型的通用智能水平、特定任务表现及与人类偏好的对齐程度。 任职要求: 1. 计算机科学、机器学习、人工智能或相关专业背景。 2. 具备大语言模型 Post-training 或强化学习相关研究/项目经验。 3. 精通 Python 编程,熟练掌握 PyTorch、vLLM 等深度学习框架,具备优秀的软件工程实践能力。 加分项: 1. 在 NeurIPS、ICLR、ICML、ACL 等人工智能顶级会议/期刊发表过高质量论文,具备良好学术声誉。 2. 主导或核心贡献过有影响力的开源项目,并在开源社区中享有良好声誉。 3. 在 NOI、ACM-ICPC、CCSP 等国内外顶级算法竞赛中获得优异成绩。 工作地点 北京/杭州/上海均可 算法或工程都可以,欢迎发送简历到邮箱:steventianyitang@outlook.com
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。