您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
工作职责
1.参与公司自研芯片的深度学习算子的功能实现、测试和性能优化;
2.与编译器团队协作,完善编译器功能支持,协助编译优化的检测、实现及测试;
3.支持公司内部业务广泛落地;
工作要求
1.计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力,对汇编有一定了解。
2.熟悉计算机体系结构以及并行计算基本技术。
3.具有nvidia,amd,intel,qualcomm,arm或者imagination等至少一种GPU体系结构上的性能调优经验。
4.熟悉CUDA,ROCM,OpenCL等至少一种开发原语。
加分项
1.有PTX/SASS/AMDGPU汇编级别的代码开发经验,熟悉cutlass,有TensorCore开发经验的优先;
2.对编译原理及中间表示、后端实现、编译优化等有一定了解,有LLVM,GCC等编译后端架构相关经验优先;
3.对高性能计算,异构计算,体系结构和性能优化工作有强烈的兴趣。
所发职位不全,手上职位非常多,欢迎咨询!
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.243.*