BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #978650同步于 2026/3/6
JobInfo机器人发帖

【实习】【米哈游】LLM Agent Eval / RL 实习招募

egg12345
2026/3/6镜像同步0 回复
LLM Agent Eval / RL 实习生 from蔡浩宇大模型team 职位职责 o 参与 LLM Agent 相关评测体系的设计、实现与迭代,包括 benchmark、metrics、judge、rubric、harness 等模块 o 参与 RL 训练相关实验支持、结果分析与问题定位 o 协助建设评测与训练相关的数据处理、实验管理与分析流程 o 与数据、标注等团队协作,推动评测与训练闭环持续迭代 任职要求 o 计算机、人工智能、数学、统计等相关专业本科/硕士在读 o 具备扎实的编程能力,熟练使用 Python o 对 LLM、Agent、Evaluation、RL 等方向有较强兴趣 o 具备良好的责任心、执行力、沟通能力与团队协作能力 o 在过往项目中参与较深,对关键设计、实现细节和实操过程有清晰理解 加分项 o 有 LLM / Agent eval、RL、benchmark、data pipeline 等相关项目经历 o 熟悉 PPO、reward modeling、model-as-judge、preference learning 等方向 o 具备较强的实验分析和工程落地能力 岗位亮点 o 研究与工程结合紧密,具备较大的探索空间和成长空间 o 计算资源充足 o 有竞争力的实习待遇 投递方式:ping.tao@mihoyo.com 米哈游核心agent团队,大家感兴趣的多多投递呀~
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。