BYR Achieve · 镜像论坛

【实习】【内推】【大模型算法】【美团】

2026/3/5镜像同步0 回复

大模型算法实习生（长程Agent / 多模态 / 强化学习方向）岗位职责 1. 长程Agent能力建设：探索Agent在复杂多步任务中的规划、执行与自我纠错能力，研究多Agent协作与任务交接机制，推动从短程辅助向长程自主闭环演进 2. 多模态融合：推进语音、图像与文本的原生多模态联合建模，探索流式感知交互架构，提升Agent在实时对话场景中的多维理解与响应能力 3. Agent强化学习：研究大规模Agent RL训练范式，包括可验证环境构建、长程奖励设计、Agent自我对弈数据合成等，提升Agent在真实任务中的可靠性与泛化性 4. 主动交互与记忆进化：提升Agent的主动意图澄清、不确定性感知、长程记忆管理等核心能力，探索将交互经验沉淀为可复用Skill的自我进化机制 5. 前沿探索与落地验证：跟踪复现Agent智能方向前沿工作，结合智能客服、通用助手等真实场景进行实验验证，推动技术能力沉淀岗位要求 1. 熟悉大模型原理，具备数据处理、微调、预训练、强化学习等方面的实践经验 2. 熟悉自然语言处理或多模态领域常见算法与模型，有Agent / Tool-use / 对话系统相关经验者佳； 3. 具备良好的编程能力，熟悉Python，熟练使用PyTorch等深度学习框架 4. 具备独立阅读与复现顶会论文的能力，有较强的自驱力和技术好奇心 5. 每周至少全职工作四天，保证实习至少6个月，实习须征得导师同意具备以下优先 1. 有Agent / 多Agent系统 / 强化学习（RLHF/大规模RL）相关研究或项目经验 2. 有多模态模型（Vision-Language / Speech-Language）训练或应用经验 3. 在ACL、EMNLP、NeurIPS、ICML、ICLR等会议或期刊有论文发表 4. 在开源社区或相关评测竞赛中有突出贡献或获奖经历岗位亮点 1. 团队技术氛围好，资深算法专家一对一指导 2. 充足的GPU实验资源 3. 好的idea，发论文的机会组内直推，尽量月内入职可直接发送简历至mt 联系方式:zhanghaoxing@meituan.com 或者发送简历给我：269312697@qq.com

订阅后，新回复会通过你的通知中心匿名送达。