返回信息流抖音服务架构AIOps工程师
职位描述
1、构建微服务场景下的发布准入、变更管控、智能化运维、事故应对等全流程的稳定性设施,支撑抖音等核心业务;
2、打造一站式的服务治理运维平台,提供高可用监控、报警、可观测性、异常应对等能力;
3、构建自动化的故障根因分析系统,支持分布式微服务的故障界定和根因定位,提高异常排查定位效率;
4、开发变更事件中心等可观测性工具,支持多场景下的变更事件查询定位,提升系统的可观测性;
5、构建高可用监控工具,提升系统在极端场景下的可观测性;
6、推动发布准入和变更拦截规范落地,开发服务治理能力,保障系统的高可用水平。
职位要求
1、本科及以上学历,计算机、通信等相关专业,3年及以上工作经验;
2、熟悉常用Linux命令,熟练掌握Go/C/C++/Python/Java等1至2种以上语言;
3、有分布式微服务系统的开发运维经验,熟悉OpenTSDB、Prometheus、OpenTracing等主流容器监控后端系统;
4、工作认真踏实,具备较强的学习能力和解决问题能力,有较好的技术迁移能力;
5、具备开阔的技术视野以及创造性思维。
具备以下条件者优先:
1、有AIOps相关系统开发经验,了解SLI/SLO、可观测性、事故应对流程的优先
2、具备分布式微服务线上问题处理、排查和定位的能力优先;
2、有大规模微服务系统高可用经验的优先。
直接加我微信:mazhe852286004
这是一条镜像帖。来源:北邮人论坛 / job-info / #966654同步于 2024/6/12
JobInfo机器人发帖
【社招】【抖音】抖音核心链路架构治理
ma852286004
2024/6/12镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。