返回信息流## 2026届秋招启动,加入阿里云灵骏智算管理团队,打造最强大的AI智算大脑!
### 基础平台研发工程师
工作城市:北京、杭州
招聘对象:2026届本科/硕士/博士应届毕业生
简历投递:guimin.hgm@alibaba-inc.com 或者加V:wxid_d87y805ms3v622
### 团队介绍:
我们是阿里云弹性计算——灵骏智算集群管理团队,负责构建支撑通义千问等超大规模AI模型训练的智算基础设施。
我们打造的是:
○ xx万级GPU规模的超大规模异构算力集群
○ 面向大模型训练的高可用、高效率、全自动的算力调度与管理系统
○ 融合云原生、智能调度、AIOps的下一代智能算力操作系统
### 岗位职责:你将参与构建灵骏智算集群的“大脑”系统
作为后端开发工程师,你将深入参与灵骏核心监管控系统的建设,涵盖以下方向:
1. 建设灵骏监管控系统核心能力:构建自动化、智能化的集群管理平台,持续提升客户在云上使用灵骏产品的易用性与智能化水平。
2. 打造智算集群全栈管理体系:主导或参与智算集群库存管理与节点生命周期管理、高效节点调度与资源编排系统、性能分析、故障自动发现与自愈系统、面向租户的一站式运维能力(可观测性、诊断、自助服务)等
3. 保障系统高可用与稳定性:建设管控系统自身高可用体系,提升管控组件故障自动定位与恢复能力,提升SLA保障体系,确保业务持续可用
4. 构建异构算力统一调度系统:设计并实现面向GPU、DPU等异构芯片的统一资源抽象与调度框架,持续提升集群资源利用率,降低单位算力成本。
5. 前沿技术探索与创新落地:跟进AI智算、云原生、智能运维(AIOps)等前沿技术趋势,结合真实业务场景进行技术预研与工程落地。
### 职位要求
我们寻找热爱技术、追求极致的系统构建者,期待你具备以下条件:
1. 本科及以上学历,计算机、软件工程、人工智能等相关专业背景
2. 编程基本功扎实,熟练掌握 Golang / Java / Python / C++ 中至少一种语言
3. 扎实掌握数据结构、算法、操作系统、网络、数据库等基础知识
4. 具备优秀程序员的基本素养和编码规范意识
5. 对分布式系统、高并发、高可用架构有基本理解
想要投递的同学,简历命名“学校+学历(博士/硕士/本科)+姓名+岗位”发送至邮箱:guimin.hgm@alibaba-inc.com 或者加V:wxid_d87y805ms3v622
这是一条镜像帖。来源:北邮人论坛 / job-info / #976057同步于 2025/9/1
JobInfo机器人发帖
【内推】【校招】阿里云-弹性计算-灵骏智算管理 2026届秋招内推
hgm
2025/9/1镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。