返回信息流地点:北京 / 成都
## 如何投递:
我们期待你的加入,共同塑造智能网络的未来!
实习投递链接: https://job.toutiao.com/s/K5vKK_tywc4
社招投递链接: https://job.toutiao.com/s/W5CAANoTjmo
联系方式 guoshixian@bytedance.com / 17866553371 / https://www.linkedin.com/in/shixianguo/
## 我们的愿景
在字节跳动,我们致力于构建全球领先的超大规模数据中心网络,以支撑数以亿计用户的实时访问和海量数据的爆发式增长。我们相信,下一代网络运维的核心驱动力将来自以大语言模型(LLM)为代表的人工智能技术。我们正在寻找一位充满激情、兼具网络技术深度与 AIOps 创新能力的开发工程师,与我们一同定义和构建“自动驾驶”的数据中心网络,将网络运维从被动的“救火队”模式,升级为主动的、数据驱动的、具备预测和自愈能力的智能生命体。
我们期待你加入,负责以下工作:
作为团队的核心成员,你将与我们的网络工程师(NetOps)、SRE 和平台研发团队紧密协作,直面全球最大规模数据中心网络的复杂性与挑战,设计并实现 AIOps for network 的完整能力闭环:
- 构建全景网络可观测性平台:打造覆盖物理和虚拟网络的 Streaming Telemetry 数据管道,整合 gNMI、Netconf、IPFIX/NetFlow、SNMP 等多源数据,为 AIOps 提供高质量、高时效性的数据基石。
- 研发智能诊断与根因分析系统:应用机器学习与深度学习算法,对海量网络指标、日志、事件进行异常检测、关联分析与智能降噪,快速定位从光模块、交换机硬件、协议邻居到应用层流量的全链路故障根因。
- 探索 LLM 与 Agent 的创新应用:
- 智能运维助理:构建基于 RAG(检索增强生成)的运维对话机器人,使其能理解自然语言问题,自动查询知识库与监控数据,提供精准的故障排查指引和网络状态报告。
- 自动化修复与智能 Runbook:训练运维 Agent,使其能够安全、可控地调用网络工具与 API。基于对故障场景的理解,自主生成、推荐甚至执行修复方案与应急预案(Runbook)。
- 建设容量与风险预测能力:基于历史数据和业务增长模型,预测网络容量瓶颈、高风险链路与“亚健康”设备,驱动主动扩容和预防性维护。
- 打造坚如磐石的工程体系:遵循最佳工程实践,设计和开发高可用、可扩展的 AIOps 平台与服务。保障从数据采集、模型训练、在线推理到自动化闭环全流程的稳定性和性能。
我们希望你具备:
- 扎实的计算机与网络基础:深刻理解数据中心网络架构(如 Spine-Leaf Fabric),熟悉 EVPN/VXLAN、BGP/OSPF 等关键协议,并对 Linux 网络协议栈有深入的了解。
- 卓越的软件工程能力:精通 Golang 或 Python,具备出色的编码和系统设计能力。熟悉微服务、容器化(Docker/Kubernetes)以及 CI/CD 等现代软件开发流程。
- 丰富的平台研发经验:在以下一个或多个领域有实践经验者优先:
- 大数据处理:熟悉 Kafka、Flink、ClickHouse/TSDB 等,有构建实时数据管道和分析系统的经验。
- 可观测性技术:熟悉 Prometheus/OpenTelemetry、图数据库(如 Neo4j),有告警与事件平台开发经验。
- AIOps/ML/LLM 的实践热情:
- 对应用机器学习(如异常检测、事件关联、根因分析)解决实际运维问题充满热情,有相关项目经验。
- 密切关注大模型与 Agent 技术发展,对 LLM 在运维领域的应用(如 RAG、工具调用、安全评估)有思考或实践经验。
- 优秀的综合素质:具备强烈的技术好奇心、出色的问题分析与解决能力,以及良好的沟通协作精神。你能够将复杂的场景抽象为清晰的技术方案,并推动其落地。
## 加分项:
- 在超大规模(十万台服务器以上)数据中心网络的运维或研发经验。
- 主导或深度参与过基于 LLM/Agent 的运维智能化项目,并取得显著业务成果。
- 对开源社区有积极贡献,如 SONiC、P4/PINS、eBPF、Prometheus、OpenTelemetry 等。
- 在高性能网络(RDMA/RoCE)、智能网卡(NIC Offload)、DPDK/eBPF 等领域有深入研究或实践。
- 有构建网络配置与控制器(如基于 SONiC/gNMI/Netconf)的经验。
## 团队学术成果与代表论文
- SIGCOMM 2024 — [R-PingMesh](https://dl.acm.org/doi/10.1145/3651890.3672264)
- SIGCOMM 2025 — [ByteTracker](https://dl.acm.org/doi/10.1145/3718958.3750515)
- NSDI 2026 — [Skyline](https://www.usenix.org/conference/nsdi26/presentation/guo-shixian)
这是一条镜像帖。来源:北邮人论坛 / job-info / #978628同步于 2026/3/5
JobInfo机器人发帖
【社招】【实习】【字节】AIOps 开发工程师 — 数据中心网络方
nee
2026/3/5镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。