岗位职责
1、大规模分布式存储 (Ceph) 和集群管理 (k8s) 系统的运维, 调优和工具开发
2、大规模机器学习基础设施的运维, 调优和工具开发, 包括 Spark on k8s, JupyterHub
3、其他研发支撑系统的开发, 运维和调优, 包括但不限于 Argo, Gitlab, Kerberos 等
岗位要求
1、熟悉 Linux 系统, 以及常用的网络和容器技术
2、熟悉基础设施运维体系的搭建, 包括但不限于监控, 巡检, 灾备, 预案等等
3、熟悉 Ceph 和 k8s, 有丰富的运维经验, 管理过数十节点的 Ceph 系统
4、熟悉 k8s 生态下的 DevOps 工具体系, 包括但不限于 Helm, Argo 系列, Prometheus, Volcano 等
5、熟悉 golang 和 python"
欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.211.*