您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
职位描述
1、负责公司相关产品的监控告警、故障应急建设,提升服务整体稳定性;
2、深入业务场景,制定符合业务特性的监控和应急方案,完成落地;
3、负责相关产品的告警治理、SLA设计与保障、应急处理等相关工作;
4、参与设计、实现高效的监控发现、应急协同等稳定性工具或平台。
职位要求
1、大规模系统的稳定性建设和保障经验;
2、对大规模分布式系统的故障发现,故障排查有强烈兴趣;
3、扎实的计算机基础知识,开发语言Python/Go/Java/C++等;
4、加分项:在监控报警和故障应急建设上有丰富经验。
所发职位不全,手上职位非常多,欢迎咨询!
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.243.*