岗位职责
1、优化算法模块并部署在嵌入式计算平台上, 包括ARM平台、Qualcomm平台、Nvidia平台、地平线平台、华为MDC平台等;
2、持续优化端上CPU/GPU/DSP的资源管理、调度策略、加速引擎, 压榨硬件性能;
3、调研和优化深度学习推理框架在嵌入式计算平台上的性能;
4、研发完善嵌入式计算平台的性能/功能相关的工具链;
任职要求
1、本科以上,计算机科学/电子工程/数学等相关专业;
2、熟练掌握C/C++,Python;
3、具备计算机体系结构和并行计算知识,熟悉x86/Arm/GPU/DSP的特点并能根据其开发相应模块;
4、对GPU逻辑结构和CUDA编程模型有清楚了解, 具备手写CUDA Kernel能力,熟悉CUDA相关工具链,如cuobjdump, nvprof, MPS, TensorRT, cuDNN, cuBlas等
5、熟悉高通平台开发,掌握DSP相关算子开发和性能优化,并有相关AI模型移植和优化经验优先
6、熟悉华为、地平线等平台开发和性能优化的优先。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.211.*