您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
工作内容:
1.参与收集、处理、清洗各种渠道的原始文本数据包括但不限于网页数据、电子书数据等
2.与大模型算法团队、数据爬虫团队、分布式训练工程团队密切合作,建立数据系统迭代流程
3.建立针对大模型的数据质量评估方法,持续提高数据质量和多样性安全性,有用性
我们希望你是:
1.有搜索、推荐、广告等业务数据的处理经验
2.有大规模中文网页数据收集和清洗经验者优先有文本数据集搭建和数据质量管理经验者优先
工作地:北京,全职
我们的优势:
1.顶尖GPU集群算力支持,快速迭代实验建立数据scaling-law
2.深度参与到千亿至万亿大型语言模型训练的数据系统迭代流程
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.190.149.*