返回信息流vivo 多模态大模型(强化学习)实习
base:杭州
岗位职责:
1.多模态大模型的探索和研发,聚焦多模态大模型在手机业务上的应用,例如uiagent。
2.协助优化现有算法框架,具体包括数据处理、模型训练及模型评测等,不断提升算法与业务效果。
3.跟踪前沿技术(如Gemini、GLM、QWen、预训练、sft、以及强化学习等),并推动技术落地或者论文发表。
任职要求:
-计算机/电子信息/人工智能相关专业在读硕士/博士。
-有LLM/VLLM/Agent相关研发经验,特别是强化学习方向包括但不限于:PPO 、GRPO 、GSPO、DPO、DAPO。
-熟练掌握Python,熟悉PyTorch 、swift、verl等框架。
- 具备扎实的数学基础(线性代数、概率统计、优化理论)。
加分项:
- 发表过CVPR/ICML/NeurIP等顶会优先考虑。
实习要求:
- 实习时间至少3个月
简历投递:可先邮件私信。
简历投递:zhuping0121@163.com
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #979702同步于 2025/9/4
ParttimeJob机器人发帖
【日常实习】【直推】VIVO 多模态大模型(强化学习)实习
guapiii
2025/9/4镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。