BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #979035同步于 2026/3/19
JobInfo机器人发帖

【2027届转正实习】【组内直招】【腾讯-金融科技】

binxin
2026/3/19镜像同步0 回复
腾讯金融科技:大模型后训练算法实习生(27届可转正、深圳),学弟学妹们速来 团队简介: 在这里,你将有机会接触到数亿级真实交易数据,利用最前沿的大模型技术解决金融支付、智能客服、风控合规及内部生产力工具等领域的复杂挑战。我们拥有充足的算力资源、海量的业务数据以及浓厚的学术氛围。 岗位描述: 1、模型训练与调优 (1)参与大模型后训练(SFT、DPO、RLHF、GRPO等)算法的设计与实现,针对支付内垂直领域,提升模型对行业术语、合规要求、复杂逻辑的理解能力。 (2)构建垂类专属奖励模型(Reward Model),融合领域知识(如内部知识、金融风控规则等)优化模型输出的准确性。 2、场景落地实验 (1)将后训练模型部署至行业分类、合规管控、金融风控等场景,优化模型在真实业务中的推理准确率与响应速度。 (2)分析模型在业务场景应用中存在的问题,并针对问题完成模型优化方案设计和实验,提升模型应用效果。 背景要求: 计算机、数学、自动化等相关专业的在读硕士或博士 学术基础: 1、扎实的机器学习/深度学习理论基础,熟悉Transformer、强化学习(RL)等核心原理,熟悉大模型训练细节。 2、熟练掌握Python编程,精通PyTorch框架,具备数据处理与实验设计能力。 3、有 LLM 微调、强化学习或自然语言处理(NLP)相关项目经验者优先。 素质能力: 具备优秀的逻辑思维能力和解决问题能力,对新技术充满好奇心,能够阅读并实现前沿论文。 实习时长: 4月中旬左右能到岗。 加分项: 在 NeurIPS, ICML, ICLR, ACL, EMNLP 等顶会发表过高质量论文。 在 Kaggle、天池等主流算法竞赛中获得过优异名次。 有大规模分布式训练优化经验或算子开发经验。 熟悉开源社区(如 HuggingFace, Llama-Factory 等)并有贡献者。 咨询微信:buptlixin 有意者可带简历私信或邮箱:shirley_x0708@163.com
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。