您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
岗位职责:
配合产品开发团队,保障数据平台的关键服务和重要基础设施的稳定、可靠地运行;
工作内容:
1. 深入理解业务,持续提升业务SLO/SLA;
2. 通过持续的全方位数据运营(包括可用性指标.历史事故.资源利用率等),找到系统容量、可用性、稳定性方面的薄弱点,并推进落地改进项目;
3. 参与建设运维工具.平台,推进运维自动化,量化数据,使用代码解决线上问题;
4. 参与故障应急响应处理,持续打磨监控系统,提升报警准确率,缩短故障定位时长;
5. 积累运维最佳实践,为业务及基础设施架构设计与资源选型提供指导,输出标准运维流程文档;
岗位要求:
1. 5年及以上相关工作经验,计算机科学或相关专业(通信、电子、信息、自动化等)优先;
2. 熟悉主流云厂商及服务,如AWS/GCP/Azure/AliCloud等;
3. 云环境管理与优化经验,包括成本管理,安全管理,运维管理,应用架构优化;
4. 熟悉业内流行的大数据或消息队列等分布式系统平台:Aerospike, Kafka, Hadoop,Yarn,HDFS,Hbase,Druid或其他NoSQL系统等;
5. 积极拥抱 “Infrastructure as Code”思想并有较丰富的实践经验,熟悉相关厂商及开源解决方案,如CloudFormation/Terraform等;
6. 运维平台设计与使用经验,如设计或参与开发过运维管理平台:资源管理,K8s管理,配置管理等;
7. 对多种云计算基础服务有较丰富的实践操作经验,包括但不限于: VPC, Subnets, Security Group, EC2, S3, IAM, Route 53, Security Hub etc;
8. 深入理解Linux操作系统,并掌握多种开源解决方案及相应技能:Kubernetes/Container/Nginx/Ansible/Prometheus/Grafana/ELK;
9. 熟悉Golang开发语言为优;
10. 工作积极主动,有强烈的责任心,执行能力强;善于思考总结,有很强的学习、问题分析和推进解决能力;
11. 基本的英文听说能力,较强的读写能力,能够快速融入英文工作环境。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.190.149.*