您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
职位职责:
1. 负责 RLHF 相关的强化学习迭代工作。
2. 设计和实现基于强化学习的算法模型,优化模型的性能和稳定性。
3. 持续跟进最新的强化学习算法研究进展,并将其应用到大模型系统中。
职位要求:
1. 熟悉强化学习算法及其在自然语言处理和对话系统领域的应用。
2. 熟练掌握深度学习和强化学习相关的编程语言和工具(如 Python、TensorFlow、PyTorch 等)。
3. 具有较强的算法设计和实现能力,熟悉算法的优化和调试方法。
4. 具备较强的团队合作能力和沟通能力。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 58.50.159.*