BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #962595同步于 2024/4/10
ParttimeJob机器人发帖

【实习】【中国电信北京研究院】招募大模型推理工程师(基于鲲

zeyazhu
2024/4/10镜像同步0 回复
实习岗位名称: 大模型推理工程师(基于鲲鹏服务器、华为昇腾NPU) 所需人数: 2 招募公司: 中国电信北京研究院 所属部门组: 云网运营技术研究所 联系方式: vx:zeyazhu 答复时间(如每日8点答复email等): all good 工作地点: 线下线上均可(鼓励线下) 交通情况(北邮为出发点,包括公交,地铁,达到时间): 北邮西门日常有园区班车 任职资格 -- 基本条件: 扎实的Linux OS操作经验,C、Python开发经验,docker/k8s使用经验 任职资格 -- 优先条件: 具备NPU部署过推理模型经验者优先,CUDA系推理模型使用者次之。 工资情况: 基本工资2k,绩效2k,开发额外+500 实习时间(包括实习期的长度,每日实习的时间): 保证3个月时间以上,上不封顶。 福利情况(包括是否包吃住等): 工作职责: 学习、熟练掌握基本昇腾系 AI加速驱动库——昇腾框架——推理框架——模型运行的AI模型推理流程。 对AI k8s环境提供维护,进行直通插件研究。 职业资料(这里介绍职业的相关资料,如前景等): 研究背景:自美国制裁以来,昇腾加速卡是目前市面可获取唯一比拟英伟达系列的加速卡,国内AI大模型训练推理将转向昇腾框架进行承载,仅我司已到货超过万卡。然而CANN加速库生态与CUDA成熟生态不同,需要进行迁移适配和优化以发挥最大效能,目前研究门槛较高仍处于初期阶段。 本团队将以大模型资源调度高效利用为研究课题,深入探索NPU时分虚拟化后多路部署推理模型(baichuan、TeleChat、llama)带来的token吞吐能力提升;并为训推混部、在离线混部等资源调度方案提供落地。 现有A800-9000 A2训练服务器就位,8卡昇腾910 B3.资源昂贵,可执行实验探索任务。 补充:
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。