岗位职责:
1. 负责基于 Nvidia GPU 架构深度学习、CV 算法及计算库加速及落地;
2. 负责主导深度学习引擎框架中 CUDA 后端设计及实现;
3. 指导团队 CUDA 编程及优化方法。
基本要求:
1. 计算机、软件工程、自动化等相关专业本科及以上;
2. 精通 Nvidia GPU 体系结构、CUDA 并行编程模型及常用优化方法,2 年以上 CUDA 编程经验及算法优化经验,熟悉基于 TensorCore 编程方法;
3. 较强的 C/C++ 编程能力,熟悉常用算法、数据结构及常见设计模式;
4. 熟练掌握 CUDA 程序性能分析、问题定位及调试的能力,掌握对应 CUDA 工具的使用;
5. 良好的编程风格习惯、文档撰写能力,团队沟通协作能力;
6. 熟悉深度学习引擎框架,有相关开发经验者优先;
7. 熟悉 PTX/SASS ,有编译优化经验者优先;
加分项:
1. 熟悉深度学习量化方法;
2. 熟悉稀疏矩阵优化方法;
3. 熟悉自动驾驶相关算法;
4. 熟悉其他并行计算体系结构。
欢迎咨询!
手机号同微信:18519274080
邮箱:herocanjob@163.com
--
FROM 122.189.211.*