返回信息流(帮转)
阿里高德北京Research Intern(感兴趣的小伙伴看过来):大模型后训练强化学习方向。
- 岗位职责:构建适用于高德信息分发场景的RLHF技术体系,包括SFT,RM,RL/Reasoning、Agentic Planning等能力的建设。
- 组内情况:有充足的GPU资源及完善的指导,实习优秀者可在组内转正。
- 我们希望你:1)可以实习6个月以上,长期更佳。2)具备RLHF相关项目或科研经验,有意愿深入学习。
简历可发送: lida.ucas@gmail.com
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #982213同步于 2025/12/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖
【实习】【长期】阿里高德北京 科研实习生 大模型后训练强化学
linuCong
2025/12/14镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。