您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
职位描述:
1. 负责机器学习、NLP领域超大模型的工程化落地,探索业界领先的大模型框架;
2. 负责超大模型的部署、调优,确保模型在各种软硬件架构上的功能、性能、稳定性;
3. 深入探索针对大模型的训练&推理加速,具备对标业界领先水准的加速能力。
任职资格:
1. 硕士及以上学历,计算机相关专业背景;
2. 具备5年以上模型工程的经验,特别是训练&推理加速的经验;
3. 具备超大规模模型的后端开发经验,了解数据并行、流水线并行、tensor并行的训练方法,有多机多卡并行的大规模联合训练经验;
4. 有大规模机器学习平台的架构设计经验,对平台高性能、高可用有着深入的研究;
5. 对Tensorflow&Pytorch等开源模型框架,有深入的研究和实践经验。有开源模型框架优化经验的优先;
6. 熟悉Megatron\DeepSpeed\ColossalAI\OneFlow等开源框架或系统优先。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.190.149.*