岗位职责:
1. 负责公司内Kubernetes平台的云原生演化方案,包括多集群API管理、容器运维平台、发布中台、容器核心组件、网络、安全、存储、日志和监控的可持续架构演化;
2. 全链路架构设计和持续优化,敏锐的根据生产网运维数据和平台运营中的事件归纳,根因整理,系统性驱动平台研发过程中技术迭代,对平台运营环境中存在的稳定性问题根治和不断完善;
3. 负责容器平台智能化调度系统的架构与建设,能结合容器平台之上复杂多样的业务类型,提出产品能力的评估模型与优化建议,提升平台的稳定性与高效性;
4. 负责容器平台的高可用体系设计和演进,设计调度系统、高性能可扩展的弹性伸缩、性能优化等提供解决方案并推进演进;
5. 负责计算类、机器学习/深度学习、在线等各种类型业务的混部资源调度,设计和研发高并发、低延迟、大规模的调度技术;
6. 负责自动化运维平台规划设计、实现及优化工作,提升集群与平台稳定性。
任职要求:
1. 本科及以上学历,计算机及相关专业,5年以上大规模集群运维经验者;
2. 深入理解linux操作系统,网络、存储、安全等计算机体系结构层面的知识,具备常见内核态问题的排查分析技术能力;
3. 深入理解Kubernetes云原生的整体技术体系,核心组件架构和项目实现方法,有Mesos/Kubernetes/docker/Istio等相关架构开发设计、实施交付和持续优化能力者;
4. 深入理解微服务业务治理经验,对服务注册发现、API网关、调用链跟踪等有深入理解和运维经验;
5. 掌握Sdn、Vxlan、Bgp、Lvs, Nginx, Haproxy等网络接入层技术解决方案,有架构设计和实施能力者;
6. 熟悉微服务应用开发中的技术和过程,掌握各种开发框架和技术,有深入的问题根因分析和故障排查的技术手段和能力;
7. 生产级别大规模云原生Prometheus/Grafana等监控系统部署和运维经验者;
8. 良好的中英文沟通能力,有分布式系统,在线离线混合系统部署和开发经验者优先。
欢迎咨询!
手机号同微信:18519274080
邮箱:herocanjob@163.com
--
FROM 122.189.211.*