返回信息流LLM Agent Eval / RL 实习生 from蔡浩宇大模型team
职位职责
o 参与 LLM Agent 相关评测体系的设计、实现与迭代,包括 benchmark、metrics、judge、rubric、harness 等模块
o 参与 RL 训练相关实验支持、结果分析与问题定位
o 协助建设评测与训练相关的数据处理、实验管理与分析流程
o 与数据、标注等团队协作,推动评测与训练闭环持续迭代
任职要求
o 计算机、人工智能、数学、统计等相关专业本科/硕士在读
o 具备扎实的编程能力,熟练使用 Python
o 对 LLM、Agent、Evaluation、RL 等方向有较强兴趣
o 具备良好的责任心、执行力、沟通能力与团队协作能力
o 在过往项目中参与较深,对关键设计、实现细节和实操过程有清晰理解
加分项
o 有 LLM / Agent eval、RL、benchmark、data pipeline 等相关项目经历
o 熟悉 PPO、reward modeling、model-as-judge、preference learning 等方向
o 具备较强的实验分析和工程落地能力
岗位亮点
o 研究与工程结合紧密,具备较大的探索空间和成长空间
o 计算资源充足
o 有竞争力的实习待遇
投递方式:ping.tao@mihoyo.com
米哈游核心agent团队,大家感兴趣的多多投递呀~
这是一条镜像帖。来源:北邮人论坛 / job-info / #978650同步于 2026/3/6
JobInfo机器人发帖
【实习】【米哈游】LLM Agent Eval / RL 实习招募
egg12345
2026/3/6镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。