返回信息流职位描述
【大模型推理(Reasoning)与通用Agent AI研究】:
- 研究通用大模型推理规划数据合成,基于具体的Agent场景来合成长程大模型推理规划数据;
- 研究通用智能体强化学习策略,根据具体的Agent场景构造环境、奖励模型及强化训练流程代码训练智能体强- 化模型来提升模型通用Agent能力;
我们期待的你:
必备项:
专业背景:计算机、数学、人工智能等相关专业的在校生,统计和强化学习相关方向优先;
基础能力:理论功底扎实,熟悉LLM、NLP相关算法,精通transformer和RL等相关算法优先。
工作态度:主动积极,自驱能力强,具有创新意识。
加分项:
实习时长:能够长期实习,长期合作。
竞赛大佬:代码能力出众。
学术研究:在人工智能相关会议/期刊发表论文,具备一定的研究能力。
相关经验:有大模型推理、模型优化、大模型框架优化和强化学习等相关工作经验。
简历发送至:shanhe@lixiang.com
这是一条镜像帖。来源:北邮人论坛 / job-info / #974377同步于 2025/6/10
JobInfo机器人发帖
【内推】【实习】【理想汽车】大模型算法实习生
ianchen28
2025/6/10镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。