您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
工作职责:
1、负责小红书大规模机器学习平台的后台系统设计和开发工作;
2、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升深度学习的训练效率,涉及k8s/kubeflow、网络通信、分布式训练等;
3、设计和构建 K8S 场景下的资源调度系统,参与底层GPU训练资源的调度优化与管理;
4、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。
任职要求:
1、计算机相关专业,精通至少一门语言,Golang/C++/Python;
2、具有扎实的代码功底和实战能力;
3、熟练掌握k8s,有k8s或kubeflow的丰富实战经验;
4、熟悉了解深度学习框架/分布式训练(tensorFlow/pytorch/horovod)优先责任心强、合作沟通顺畅。 【加分项】
● 熟悉深度学习框架和底层实现;
● Kubernetes 相关开源项目或模块的贡献者;
● 有大规模集群资源调度的实践经验。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.211.*