岗位职责:
1. 参与研发 AI 计算平台, 支撑超大规模算法训练.
2. 参与设计和研发AI训练框架和工具体系,提高算法工程师效率, 优化计算能力.
岗位要求:
1.熟练掌握操作系统原理,计算机网络原理;
2.优秀的编码能力,熟练掌握 Golang/Python/C/C++ 至少一门语言
3.有 Kubernetes 开发使用经验, 了解分布式训练基本流程
加分项:
- 有算法训练经验, 或 AI 计算平台开发使用经验
- 有 Volcano, Kubeflow, Argo, Fluid, GPU-manager 等开源软件使用/开发经验
- 了解常用的分布式存储, 有相关使用/二次开发经验
- 了解分布式训练中通信模型, 对 Horvod 有使用/二次开发经验"
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.190.149.*