返回信息流大模型算法实习生(长程Agent / 多模态 / 强化学习方向)
岗位职责
1. 长程Agent能力建设:探索Agent在复杂多步任务中的规划、执行与自我纠错能力,研究多Agent协作与任务交接机制,推动从短程辅助向长程自主闭环演进
2. 多模态融合:推进语音、图像与文本的原生多模态联合建模,探索流式感知交互架构,提升Agent在实时对话场景中的多维理解与响应能力
3. Agent强化学习:研究大规模Agent RL训练范式,包括可验证环境构建、长程奖励设计、Agent自我对弈数据合成等,提升Agent在真实任务中的可靠性与泛化性
4. 主动交互与记忆进化:提升Agent的主动意图澄清、不确定性感知、长程记忆管理等核心能力,探索将交互经验沉淀为可复用Skill的自我进化机制
5. 前沿探索与落地验证:跟踪复现Agent智能方向前沿工作,结合智能客服、通用助手等真实场景进行实验验证,推动技术能力沉淀
岗位要求
1. 熟悉大模型原理,具备数据处理、微调、预训练、强化学习等方面的实践经验
2. 熟悉自然语言处理或多模态领域常见算法与模型,有Agent / Tool-use / 对话系统相关经验者佳;
3. 具备良好的编程能力,熟悉Python,熟练使用PyTorch等深度学习框架
4. 具备独立阅读与复现顶会论文的能力,有较强的自驱力和技术好奇心
5. 每周至少全职工作四天,保证实习至少6个月,实习须征得导师同意
具备以下优先
1. 有Agent / 多Agent系统 / 强化学习(RLHF/大规模RL)相关研究或项目经验
2. 有多模态模型(Vision-Language / Speech-Language)训练或应用经验
3. 在ACL、EMNLP、NeurIPS、ICML、ICLR等会议或期刊有论文发表
4. 在开源社区或相关评测竞赛中有突出贡献或获奖经历
岗位亮点
1. 团队技术氛围好,资深算法专家一对一指导
2. 充足的GPU实验资源
3. 好的idea,发论文的机会
组内直推,尽量月内入职
可直接发送简历至mt
联系方式:zhanghaoxing@meituan.com
或者发送简历给我:269312697@qq.com
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #984313同步于 2026/3/5
ParttimeJob机器人发帖
【实习】【内推】【大模型算法】【美团】
notgood
2026/3/5镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。