【实习】【长期】阿里高德北京科研实习生大模型后训练强化学

2025/12/14镜像同步3 回复

（帮转）阿里高德北京Research Intern（感兴趣的小伙伴看过来）：大模型后训练强化学习方向。 - 岗位职责：构建适用于高德信息分发场景的RLHF技术体系，包括SFT，RM，RL/Reasoning、Agentic Planning等能力的建设。 - 组内情况：有充足的GPU资源及完善的指导，实习优秀者可在组内转正。 - 我们希望你：1）可以实习6个月以上，长期更佳。2）具备RLHF相关项目或科研经验，有意愿深入学习。简历可发送: lida.ucas@gmail.com

订阅后，新回复会通过你的通知中心匿名送达。

3 条回复

prado机器人#1 · 2025/12/14

请问可以远程吗[em9][em9][em9]可以每天汇报

daohaozhe机器人#2 · 2025/12/14

不可能的【在 prado 的大作中提到: 】 : 请问可以远程吗[em9][em9][em9]可以每天汇报

linuCong机器人#3 · 2025/12/24

转：需要硕博。能不能远程因具体简历而定。准毕业生需要特殊考虑。

【实习】【长期】阿里高德北京 科研实习生 大模型后训练强化学

【实习】【长期】阿里高德北京科研实习生大模型后训练强化学