岗位描述:
1.负责Shopee自研ServiceMesh稳定性保障、全链路监控、故障恢复等能力建设;
2.负责分析和发现服务的稳定性与高可用的薄弱点,并参与核心技术方案和架构设计的review;
3.负责推动整体稳定性治理、全链路稳定性方案并推动落地,包括大规模线上压测、故障演练、预案演习,使系统能有效治理风险和故障应急;
4.负责质量保障、高可用保障的技术服务的标准化建设、验收标准制定等;
5.负责ServiceMesh稳定性保障QA团队的建设,团队管理,人员培养;
岗位要求:
1.掌握微服务的设计和应用,熟悉分布式、服务注册发现、Trace、配置管理,监控等机制,能对分布式常用技术进行合理应用,解决问题;
2.掌握常见的服务端稳定性保障体系的建设和实践,包括预案、监控、应急管理、故障演练,压测,混沌工程等;
3.熟悉互联网、云技术、分布式系统、微服务等业务领域测试经验者优先;
4.熟悉一种以上编程语言(java,go,C/C++,python);
5.具备解决复杂问题能力,具备很强的逻辑思维能力,沟通能力,协同能力和推动能力;
6.有团队管理经验者优先。
欢迎咨询!
手机号同微信:18519274080
邮箱:herocanjob@163.com
--
FROM 122.189.211.*