BYR Achieve · 镜像论坛

【内推】【实习】美团 - 大模型算法实习生

2025/12/23镜像同步0 回复

简历发到 sunjiashen@meituan.com 目标岗位为项目实习生，建议是2027年或之后毕业的硕士博士。岗位职责: 1. 后训练研究：深入参与模型对齐工作，重点研究多种后训练算法；探索结果奖励和过程奖励模型的构建，提升模型在复杂逻辑下的推理能力。 2. Agentic RL优化：针对复杂业务场景，优化 Agent 的任务规划、反思与执行能力；提升模型在长链路任务中的稳定性和成功率。 3. 前沿技术落地：跟踪业界前沿技术路线，负责相关算法的复现、调优及在业务场景中的工程化落地。岗位要求: 1. 扎实的算法基础，熟悉LLM、NLP相关算法和模型；具备业务场景高质量训练数据构建的实际经验者优先。 2. 熟悉 Hugging Face Transformers、PyTorch 等主流深度学习框架；具备Agent研发的实际经验者优先。 3. 有 LangGraph、Swarm 等Agent框架使用经验，熟悉 MCP 协议及工具生态。有多智能体协作或复杂规划任务研发经验。 4. 在ACL、EMNLP、NAACL、SIGIR等自然语言处理会议或期刊中有论文发表者，或在 Kaggle 及大模型相关榜单中取得优异成绩者优先。 5. 每周至少全职工作四天，保证实习至少4个月。实习须征得导师同意。岗位亮点: 1. 直接参与大模型最核心的 RL 对齐与 Agentic Reasoning 研究。 2. 资深算法专家一对一辅导，团队技术氛围浓厚。 3. 提供充足的计算资源及高质量的真实业务反馈数据（Human Feedback）。 4. 支持高水平论文合作发表及开源社区贡献。

订阅后，新回复会通过你的通知中心匿名送达。