岗位职责:
1. 云端模型部署场景中,业务请求量巨大,对吞吐量和/或时延要求很高,同时基于资源利用率的考量,在同一个集群中部署多个不同的业务共享资源。针对场景需求,对模型进行压缩量化等优化、减少模型运算量,提高部署时推理速度。
岗位要求:
1. 本科及以上学历,计算机、软件工程、网络通信、自动化、电子电气等相关专业;
2. 精通并熟练使用C/C++/Java/Python/Rust/JS等一种以上编程语言;
3. 至少熟悉一种深度学习框架(pytorch/tensorflow);
4. 至少熟悉一种深度学习推理框架(TensorRT/ONNXRuntime/MNN/ncnn/OpenVINO等);
5. 对深度学习模型落地有实际项目经验,熟练掌握深度学习模型裁剪、压缩、量化等优化方法;
6. 较好的沟通能力,能够和团队进行高效沟通并进行敏捷式开发,性格乐观,积极向上。
欢迎咨询!
手机号同微信:18519274080
邮箱:herocanjob@163.com
--
FROM 122.189.211.*