BYR Achieve · 镜像论坛

【实习】【中国电信北京研究院】招募大模型推理工程师（基于鲲

2024/4/10镜像同步0 回复

实习岗位名称: 大模型推理工程师（基于鲲鹏服务器、华为昇腾NPU）所需人数: 2 招募公司: 中国电信北京研究院所属部门组: 云网运营技术研究所联系方式: vx:zeyazhu 答复时间(如每日8点答复email等): all good 工作地点: 线下线上均可（鼓励线下）交通情况(北邮为出发点,包括公交,地铁,达到时间): 北邮西门日常有园区班车任职资格 -- 基本条件: 扎实的Linux OS操作经验，C、Python开发经验，docker/k8s使用经验任职资格 -- 优先条件: 具备NPU部署过推理模型经验者优先，CUDA系推理模型使用者次之。工资情况: 基本工资2k，绩效2k，开发额外+500 实习时间(包括实习期的长度,每日实习的时间): 保证3个月时间以上，上不封顶。福利情况(包括是否包吃住等): 工作职责: 学习、熟练掌握基本昇腾系 AI加速驱动库——昇腾框架——推理框架——模型运行的AI模型推理流程。对AI k8s环境提供维护，进行直通插件研究。职业资料(这里介绍职业的相关资料,如前景等): 研究背景：自美国制裁以来，昇腾加速卡是目前市面可获取唯一比拟英伟达系列的加速卡，国内AI大模型训练推理将转向昇腾框架进行承载，仅我司已到货超过万卡。然而CANN加速库生态与CUDA成熟生态不同，需要进行迁移适配和优化以发挥最大效能，目前研究门槛较高仍处于初期阶段。本团队将以大模型资源调度高效利用为研究课题，深入探索NPU时分虚拟化后多路部署推理模型（baichuan、TeleChat、llama）带来的token吞吐能力提升；并为训推混部、在离线混部等资源调度方案提供落地。现有A800-9000 A2训练服务器就位，8卡昇腾910 B3.资源昂贵，可执行实验探索任务。补充:

订阅后，新回复会通过你的通知中心匿名送达。