岗位描述:
1. 负责Shopee资源调度平台,应用发布平台和配套周边系统的设计、开发、实施、优化及维护;
2. 持续改进调度系统可用性、稳定性、安全性和扩展性,保障日常和活动促销时资源调度平台的平稳运行;
3. 持续提升Shopee的资源利用率,改进大规模在线服务和离线任务混合部署场景的调度模型;
4. 持续增强资源调度平台的隔离性,结合不同业务形态的需求,改善容器和虚拟机在内存带宽,磁盘IO,网络QoS的资源管控;
5. 改善系统易用性和可维护性,结合业务需求和日常支持反馈,优化系统流程,降低学习和使用成本;
6. 建设自动化及工程化的解决方式,实施混沌工程和进行定期故障演练,提前发现和修复潜在风险,减少人工介入和手工运维工作,实现大部分情况下的故障自愈;
7. 担任Scrum master,带领并建设运维团队。
岗位要求:
1. 全日制本科及以上学历,5年以上工作经验,有团队建设和项目管理经验。
2. 熟练掌握Golang语言开发,具备Python, Shell等其他一种或多种语言开发经验。
3. 对Linux系统有深入了解,熟悉cgroup v2、namespace、KVM等。
4. 熟悉Linux下动态追踪和性能调优,有丰富的系统问题分析排查经验。
5. 有Openstack、Docker、Mesos、Kubernetes、微服务治理及资源调度经验者优先。
6. 熟悉监控及自动化部署平台研发,具有大规模集群调度和架构设计经验优先。
7. 有混合云管理系统设计和研发经验者优先。
8. 熟悉DevOps流程,有CI/CD平台化经验,理解传统运维痛点.
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 58.50.157.*