职位描述:
1.负责Shopee IaaS相关产品的开发和设计,包括物理机、虚拟机等机器资源的调度编排、大规模集群管理等;
2.负责机器资源池、预算管理、镜像管理、自动化装机、BMC管控、裸金属、多云管理、虚拟化平台等配套系统的研发,持续提升Shopee在大规模场景下的服务器治理水平;
3.持续改进Shopee IaaS相关产品的可用性、稳定性、安全性和扩展性,保障日常和大促时IaaS相关产品的平稳运行;
4.改善Shopee IaaS相关产品的易用性和可维护性,结合业务需求和日常支持反馈,优化系统流程,降低学习和使用成本;
5.建设自动化及工程化的解决方式,实施混沌工程和进行定期故障演练,提前发现和修复潜在风险,减少人工介入和手工运维工作,实现大部分情况下的故障自愈;
岗位要求:
1.计算机或相关专业本科及以上学历;
2.热爱编码,对于创新以及解决具有挑战性的问题充满激情;
3.全面的计算机基础知识结构(数据结构与算法、操作系统、网络、安全、数据库等);
4.熟练掌握和使用Go、Python或C++,对语言有较深理解;
(优先)有IDC服务器运维相关经验,熟悉主流x86服务器的硬件及系统知识;
(优先)有IDC规划、建设、交付经验,理解传统IDC运维痛点;
(优先)了解BIOS、BMC、服务器固件,熟悉软硬件系统分析,有软硬件一体化的相关经验;
(优先)开发、设计、实施和维护过大规模分布式系统;
(优先)贡献或维护过知名开源项目像Kubernetes、OpenStack、CloudStack、OpenBMC等;
(优先)有丰富的Linux程序调优、调试和问题排查经验;熟悉systemtap、ebpf等;
欢迎咨询!
手机号同微信:18519274080
邮箱:herocanjob@163.com
--
FROM 122.189.211.*