工作职责:
1.负责公司内部数据存储和计算平台的建设,提供公司级的平台服务;
2.负责大规模分布式与并行软件框架、资源管理与弹性调度系统、分布式系统监控与分析系统的架构设计等关键技术研究及核心代码开发工作;
3.负责机器学习集群调度及平台开发,优化平台软件栈,提升用户体验;
4.设计维护私有 Kubernetes 计算集群,设计开发公有私有云混合任务调度架构;
5.对提升集群处理能力/高可用性/高扩展性的各种解决方案进行跟踪和落地,持续提升性能和稳定性;
6.基于K8S进行二次开发,基于kubernetes开发计算平台/工具链/基础设施/容器化等;
任职要求:
1.计算机相关专业,本科及以上学历,五年以上Kubernates开发经验,博士可以不限工作年限;
2.熟悉&精通 Go/Python编程,熟悉常用算法、数据结构,熟悉 Linux 系统;
3.熟悉机器学习框架及分布式集群资源管理与调度相关的云计算技术的理念、架构、设计、实现;
4.对K8s源码有深入研究,熟悉kube-controller、 kube-scheduler、 kubelet cm等;
5.有丰富的AI相关经验,有丰富的开发经验;
6.熟悉云原生技术,熟悉私有云、公有云相关技术,有私有云搭建的实践经验;
欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.211.*