BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #975518同步于 2025/8/13
JobInfo机器人发帖

【校招】阿里云基础软件/MLSys团队招人啦

GMoto
2025/8/13镜像同步0 回复
阿里云基础软件部诚招优秀校招生(有阿里星名额!!)团队主要研究方向为大模型推理框架 & Agent相关课题。团队氛围极佳,有大佬带队,成长迅速!欢迎感兴趣的同学前来了解~ 毕业起止时间要求:2025-11-01 ~ 2026-10-31 可发简历到 eryu.gey@alibaba-inc.com 职位 1: 面向万亿参数大模型的PD分离解耦推理系统研究,主要工作是参与sglang和mooncake的研发以及贡献社区。我们团队有sglang和mooncake的maintainer,直接带同学一起搞。前景方面懂得都懂,属于最热门的AI领域了。我们还有章明星老师做顾问 职位描述 在阿里云操作系统实验室,你将负责下一代MoE大模型推理系统的架构设计与核心实现。主要工作围绕Prefill-Decode分离(PD Disaggregation)与Expert Parallelism(EP)的端到端协同,持续优化Mooncake的KVCache系统,支撑千问、灵骏、PAI等阿里云关键AI业务。主要职责是: 1、深入理解并改进Mooncake、SGLang等开源推理框架; 2、设计Mooncake KVCache分层、弹性伸缩、故障自愈等核心模块,追求毫秒级延迟与极致吞吐; 3、结合最新硬件与操作系统能力优化大模型推理系统; 4、撰写顶会论文(SOSP/OSDI等),将创新回馈开源社区。 职位要求 1、计算机相关专业; 2、精通C++/Python/CUDA; 3、熟悉分布式推理系统,理解MoE、TP/PP/EP、NCCL、RDMA; 4、良好的英文读写与团队协作能力。 【加分项】 1、在OSDI/SOSP等顶会发表过论文; 2、主导或核心贡献过vLLM、SGLang、Mooncake、Dynamo等开源项目; 3、熟悉Kubernetes、Ray、KubeRay等云原生调度系统; 4、有GPU显存管理、KVCache、RDMA网络栈优化实战经验。 工作地点 北京 职位 2: 面向操作系统全栈的智能化模型与算法研究,主要工作领域是AI for Sys,利用AI技术,特别是大模型构建agentic ai,提升基础软件的运行效率。AI Agent属于未来一段时间比较热门的AI领域 职位描述 在阿里云操作系统实验室,你将把最前沿的大模型与强化学习技术与A2A/MCP技术相结合,并注入操作系统全栈,让内核、文件系统、网络、容器调度等核心组件具备“自进化”能力。同时打造覆盖研发-测试-运维全生命周期的AI Agent体系。 1、主导AI驱动的内核调度器、内存回收、I/O 预读、网络拥塞控制等关键子系统的设计与实现; 2、研发基础软件AI Agent/OS Copilot,让补丁回合、测试用例生成、故障定位与修复实现自动化; 3、与Linux Kernel、OpenAnolis、eBPF、Kubernetes等开源社区深度合作,输出顶会论文与开源代码。 职位要求 1、计算机相关专业; 2、精通C/C++、Python,熟悉CUDA; 3、熟悉机器学习/深度学习框架(PyTorch、JAX、TensorFlow),有RL或大模型应用经验; 4、优秀的英文读写与跨团队协作能力。 【加分项】 1、在OSDI/SOSP/ICSE/FSE/ATC/MLSys等顶会以第一作者发表论文; 2、有AI驱动的系统优化、故障诊断或自动化测试项目经验; 3、有AI Agent相关研究或应用背景。 工作地点 北京
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。