职位描述:
1.负责大规模深度机器学习模型的分布式训练和预估的研发与优化,构建高效、可靠的训练平台和预估平台;
2.为推荐、搜索、广告等shopee核心业务提供完整的平台解决方案,加速算法模型的迭代效率和预估精度;
持续优化平台架构、提升系统性能以及平台规模,不断加速训练和推理的效率。
职位要求:
1.精通C++编程,熟练掌握多线程编程,锁优化,性能调优,RPC框架等技术;
2.对计算机技术有极高的热情,能够积极主动的学习,有深度钻研和实践精神,对交付的code高标准、严要求,做事严谨细心;
3.有深度学习框架开发经验的优先,有Deep Models在大规模线上生产环境落地经验者优先,有对Tensorflow/Pytorch/Paddlepaddle源码熟悉者优先;
4.有分布式系统开发经验者优先,对Parameter Server或高效索引结构熟悉者优先;
5.熟悉MPI/NCCL者优先,熟悉GPU编程者优先。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.190.149.*