返回信息流岗位职责:
1、参与团队预训练大模型的研发,包括预训练,后训练,指令微调,对齐等方向;
2、负责以大语言模型为核心的对话感知与交互,根据业务需求优化模型,提升业务效果;
3、负责跟踪和探索大语言模型的前沿问题,结合实际场景,参与前沿算法和应用的研究和专利、论文撰写。
任职要求
1、计算机相关专业硕士及以上学历,熟练掌握自然语言处理、深度学习、强化学习的基础理论和方法。
2、具有扎实的的编程能力,熟练掌握至少一门编程语言(C/C++/Python/Java),熟悉TensorFlow/Pytorch/Keras等深度学习框架。
3、熟悉Transformer/GPT系列/LLaMA/GLM等预训练模型,对模型训练和应用有一定理解。
4、了解DeepSpeed、Megatron等分布式训练框架,有一定多机多卡分布式训练与debug经验。
4、较强的技术攻关能力,能够跟进领域内最新的技术研究成果,结合实际应用场景快速实验和落地。
5、有对话、多模态领域比赛或者ACL、EMNLP、AAAI等相关顶会论文者优先。
6、每周实习4-5天、可长期实习同学优先。
简历请发送:yangys5@xiaopeng.com
办公地点:中关村-互联网金融中心
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #968579同步于 2024/9/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖
【实习】【小鹏汽车】大模型算法实习生
yushu
2024/9/27镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。