团队介绍
SRE(Site Reliabilitiy Engineering)是结合传统软件工程与系统运维形成的新的技术体系,用以组建大规模高可用的分布式系统。蚂蚁基础设施SRE负责蚂蚁全集团容器调度、service mesh中间件、缓存、统一接入等、数据计算、搜索推荐等基础设施,及三地五中心异地容灾架构演进,致力于基础设施稳定性提升、云原生架构演进。当前在杭州、上海、北京三地均有团队;
职位描述
1. 建设基础设施的高可用技术风险体系,如变更防御、异常定位和自愈系统;
2.推进基础设施云原生架构演进,如基础设施即代码(IAC)、Serverless等;
3. 标准化调度系统监控,日志采集,包括SLA的制定与故障定位;
4. 建设自动化及工程化的解决方式,以减少在传统运维层面的人力投入,做到无人值守。
层级:P5\P6\P7均可
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.211.*