返回信息流【职位描述】
1、负责可交互投放算法研发,目的是为了帮助广告主智能投放和广告系统智能纠偏;
2、使用SFT、RLHF/DPO等方法优化模型推理与COT质量;
3、基于Skills实现工具智能调用与任务规划;
4、Agent能力复用拓展至智能客服等场景。
【任职要求】
1、NLP/ML/AI相关专业或有相关实习经历;
2、熟悉LLM基本原理,了解SFT/RLHF/DPO等对齐算法优先;
3、有Agent、Function Call,Skills实际使用经验优先;
4、有大模型一作CCF-A/B论文或业务落地经验优先。
【我们的优势】
1、急招,流程快,简历直推本组;
2、方向前沿,Agent+投放场景,真实业务落地;
3、支持论文产出;
4、组里面向27届毕业生有转正hc。
简历投递:chenjingyan@kuaishou.com
[ema0][ema0][ema0]
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #984807同步于 2026/3/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖
【日常/暑期实习】快手基础大模型与应用部 |Agent方向
cjyryc
2026/3/16镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复
【 在 cjyryc 的大作中提到: 】
: 1、负责可交互投放算法研发,目的是为了帮助广告主智能投放和广告系统智能纠偏;
: 2、使用SFT、RLHF/DPO等方法优化模型推理与COT质量;
: 3、基于Skills实现工具智能调用与任务规划;
: ...................
bdbd