返回信息流阿里云基础软件部诚招优秀校招生(有阿里星名额!!)团队主要研究方向为大模型推理框架 & Agent相关课题。团队氛围极佳,有大佬带队,成长迅速!欢迎感兴趣的同学前来了解~
毕业起止时间要求:2025-11-01 ~ 2026-10-31
可发简历到 eryu.gey@alibaba-inc.com
职位 1:
面向万亿参数大模型的PD分离解耦推理系统研究,主要工作是参与sglang和mooncake的研发以及贡献社区。我们团队有sglang和mooncake的maintainer,直接带同学一起搞。前景方面懂得都懂,属于最热门的AI领域了。我们还有章明星老师做顾问
职位描述
在阿里云操作系统实验室,你将负责下一代MoE大模型推理系统的架构设计与核心实现。主要工作围绕Prefill-Decode分离(PD Disaggregation)与Expert Parallelism(EP)的端到端协同,持续优化Mooncake的KVCache系统,支撑千问、灵骏、PAI等阿里云关键AI业务。主要职责是:
1、深入理解并改进Mooncake、SGLang等开源推理框架;
2、设计Mooncake KVCache分层、弹性伸缩、故障自愈等核心模块,追求毫秒级延迟与极致吞吐;
3、结合最新硬件与操作系统能力优化大模型推理系统;
4、撰写顶会论文(SOSP/OSDI等),将创新回馈开源社区。
职位要求
1、计算机相关专业;
2、精通C++/Python/CUDA;
3、熟悉分布式推理系统,理解MoE、TP/PP/EP、NCCL、RDMA;
4、良好的英文读写与团队协作能力。
【加分项】
1、在OSDI/SOSP等顶会发表过论文;
2、主导或核心贡献过vLLM、SGLang、Mooncake、Dynamo等开源项目;
3、熟悉Kubernetes、Ray、KubeRay等云原生调度系统;
4、有GPU显存管理、KVCache、RDMA网络栈优化实战经验。
工作地点
北京
职位 2:
面向操作系统全栈的智能化模型与算法研究,主要工作领域是AI for Sys,利用AI技术,特别是大模型构建agentic ai,提升基础软件的运行效率。AI Agent属于未来一段时间比较热门的AI领域
职位描述
在阿里云操作系统实验室,你将把最前沿的大模型与强化学习技术与A2A/MCP技术相结合,并注入操作系统全栈,让内核、文件系统、网络、容器调度等核心组件具备“自进化”能力。同时打造覆盖研发-测试-运维全生命周期的AI Agent体系。
1、主导AI驱动的内核调度器、内存回收、I/O 预读、网络拥塞控制等关键子系统的设计与实现;
2、研发基础软件AI Agent/OS Copilot,让补丁回合、测试用例生成、故障定位与修复实现自动化;
3、与Linux Kernel、OpenAnolis、eBPF、Kubernetes等开源社区深度合作,输出顶会论文与开源代码。
职位要求
1、计算机相关专业;
2、精通C/C++、Python,熟悉CUDA;
3、熟悉机器学习/深度学习框架(PyTorch、JAX、TensorFlow),有RL或大模型应用经验;
4、优秀的英文读写与跨团队协作能力。
【加分项】
1、在OSDI/SOSP/ICSE/FSE/ATC/MLSys等顶会以第一作者发表论文;
2、有AI驱动的系统优化、故障诊断或自动化测试项目经验;
3、有AI Agent相关研究或应用背景。
工作地点
北京
这是一条镜像帖。来源:北邮人论坛 / job-info / #975518同步于 2025/8/13
JobInfo机器人发帖
【校招】阿里云基础软件/MLSys团队招人啦
GMoto
2025/8/13镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。