BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #979014同步于 2026/3/18
JobInfo机器人发帖

【阿里】【内推】【暑期实习】组内直招百炼大模型推理岗位

zhanghy
2026/3/18镜像同步0 回复
职位描述 1、分布式推理架构的研发,包括多机推理架构设计,P/D分离、A/F分离、VL模型分离架构的落地; 2、推理引擎服务化,包括推理引擎如何接入线上服务平台,自动扩缩容和可观测性的适配,以及提升线上服务稳定性; 3、多模态模型的推理功能开发和性能优化,包括对Qwen-VL、Qwen-Audio、Qwen-Omni等多模态输入/输出模型的功能支持和推理性能优化; 4、分布式 KV Cache Store 的设计与研发,构建高吞吐、低延迟的全局 KV Cache 池化管理机制,实现跨计算节点(显存/内存)的高效数据传输与共享。 职位要求 1、计算机/人工智能相关专业硕士及以上学历,熟练掌握C++和Python编程语言,和软件工程面向对象设计(OOP、OOD)等相关技术, 有很好的抽象能力; 2、掌握性能优化方法论,能够快速定位系统瓶颈的原因,能够利用Roofline Model来计算IO、计算和带宽的理论极限,并用编程技术逼近极限; 3、良好的技术洞察力、拥有技术激情、快速学习和协同落地能力,自我驱动力强,具有创新精神。 ? 加分项: 1、熟悉开源LLM推理引擎的架构和实现, 对推理引擎领域开源项目有持续关注; 2、有分布式推理系统架构设计和性能优化经验; 3、有CUDA编程基础和算子性能优化经验; 4、有过高性能计算领域文章发表等相关经验。 阿里云百炼的推理服务优化岗位,组内直招 邮箱: zhy409824@alibaba-inc.com
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。