BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #982465同步于 2025/12/23
ParttimeJob机器人发帖

【内推】【实习】美团 - 大模型算法实习生

bigrat911
2025/12/23镜像同步0 回复
简历发到 sunjiashen@meituan.com 目标岗位为项目实习生,建议是2027年或之后毕业的硕士博士。 岗位职责: 1. 后训练研究:深入参与模型对齐工作,重点研究多种后训练算法;探索结果奖励和过程奖励模型的构建,提升模型在复杂逻辑下的推理能力。 2. Agentic RL优化:针对复杂业务场景,优化 Agent 的任务规划、反思与执行能力;提升模型在长链路任务中的稳定性和成功率。 3. 前沿技术落地:跟踪业界前沿技术路线,负责相关算法的复现、调优及在业务场景中的工程化落地。 岗位要求: 1. 扎实的算法基础,熟悉LLM、NLP相关算法和模型;具备业务场景高质量训练数据构建的实际经验者优先。 2. 熟悉 Hugging Face Transformers、PyTorch 等主流深度学习框架;具备Agent研发的实际经验者优先。 3. 有 LangGraph、Swarm 等Agent框架使用经验,熟悉 MCP 协议及工具生态。有多智能体协作或复杂规划任务研发经验。 4. 在ACL、EMNLP、NAACL、SIGIR等自然语言处理会议或期刊中有论文发表者,或在 Kaggle 及大模型相关榜单中取得优异成绩者优先。 5. 每周至少全职工作四天,保证实习至少4个月。实习须征得导师同意。 岗位亮点: 1. 直接参与大模型最核心的 RL 对齐 与 Agentic Reasoning 研究。 2. 资深算法专家一对一辅导,团队技术氛围浓厚。 3. 提供充足的计算资源及高质量的真实业务反馈数据(Human Feedback)。 4. 支持高水平论文合作发表及开源社区贡献。
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。