职位描述:
● 负责Shopee云原生平台上的服务运营、资源分析、调度优化,持续提升集群资源利用率;
● 负责Shopee在离线混布系统的开发和设计,建立服务资源画像和完善干扰检测,保障在线业务的延迟与性能,保障日常和大促时的平稳运行;
● 负责Shopee超售平台的开发和设计,面向Shopee特有场景,落地贴合业务的解决方案;
● 持续改进Shopee Kubernetes Scheduler和Descheduler,减少资源碎片,优化大规模在线服务部署场景的调度模型;
● 负责Shopee应用模型系统及服务运营平台的开发和设计,持续提升Shopee在大规模场景下的服务治理及运营水平;
● 负责Shopee业务全局Profiling平台的开发和设计,持续降低DataCenter Tax;
● 建设自动化及工程化的解决方式,实施混沌工程和进行定期故障演练,提前发现和修复潜在风险,减少人工介入和手工运维工作,实现大部分情况下的故障自愈。
岗位要求:
● 计算机或相关专业本科及以上学历;
● 热爱编码,对于创新以及解决具有挑战性的问题充满激情;
● 全面的计算机基础知识结构(数据结构与算法、操作系统、网络、安全、数据库等);
● 熟练掌握和使用Go、Java或C++,对语言有较深理解;
● (优先)开发、设计、实施和维护过大规模分布式系统;
● (优先)贡献或维护过知名开源项目像YARN、Kubernetes、Spark、KubeFlow等;
● (优先)熟悉云原生技术栈,包括Kubernetes、Prometheus、containerd、CRI、lxcfs、etcd等;
● (优先)深入了解Linux内核一个或多个子模块的源代码,熟悉cgroup v2、KVM等;
● (优先)有较强的数据分析能力和建模能力;
● (优先)有丰富的Linux程序调优、调试和问题排查经验;熟悉systemtap、ebpf等;
● (优先)在知名期刊或顶会像ASPLOS、Eurosys、NSDI、OSDI等发表过论文。
欢迎咨询!
手机号同微信:18519274080
邮箱:herocanjob@163.com
--
FROM 122.189.211.*