您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
岗位职责
负责NLP算法、生成式AI工程化,优化模型推理框架,推进算法的服务化上线;
深度参与大模型分布式训练框架的开发和优化;
深度参与机器学习平台搭建,加速算法研发。
任职要求
熟练掌握Transformer系列模型架构原理;
熟练掌握基于GPU和CPU的深度学习模型推理加速技术,包括但不限于kernel fusion和量化等;
熟练使用C++和Python进行编程开发,熟练使用FasterTransformer、vLLM等至少一种高效推理框架;
熟练使用Megatron-LM、DeepSpeed、Colossal-AI等至少一种模型训练框架,并能基于框架进行二次开发和优化;
敢于挑战,追求卓越,有创新精神和研发热情。
加分项
熟悉GPU并行计算、熟悉CUDA编程者优先;
有LLaMA、OPT等大模型服务化经验者优先。
工作亮点
背靠清华大学自然语言处理实验室,有国内顶尖NLP技术支持;
目标远大:做国内最好的大规模中文预训练语言模型;
团队有自研大规模预训练模型经验,有深厚的NLP知识积累;
能与学术大牛一起交流讨论,探索最前沿的技术。"
所发职位不全,手上职位非常多,欢迎咨询!
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.242.*