您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
职位描述
1.对RLLib进行二次开发和维护,负责其模块的改进和bug修复;
2.研究和开发强化学习算法,如DQN、DDPG和PPO等,将其应用到实际场景,通过对比实验验证其性能,结合强化学习算法,解决实际问题和提供创新应用;
3.参与开源社区的讨论和贡献,共同推进强化学习领域的发展;
4.探索Ray在AI领域的发展;
5.有超强的分布式计算相关基础知识和分布式调度、存储、深度学习、强化学习等方面的实践经验;
6.聪明、乐观、皮实、自省、有追求卓越的心和强大的自我驱动力。
职位要求
必须具备的:
1.本科及以上学历,硕士博士优先,计算机、数学、通信、自动化等相关专业;
2.极佳的工程实现能力,熟练掌握C/C++、Java、Python等至少一门语言;
3.熟悉强化学习理论和应用,掌握深度学习框架(如TensorFlow、Pytorch、JAX等);
4.常用的强化学习算法和工具,如A3C、Q-learning、Deep Q-Networks、PPO等;
5.学习能力强,对新事物保有好奇心,并能快速适应新环境;
6.良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;
7.对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。
有一定了解的:
对分布式计算、分布式调度、深度学习、强化学习、GPU通信、RDMA通信、自然语言处理领域等有一定了解。
可以加分的:
1.有在Ray上研发经验,对Ray RLLib有深入理解;
2.ACM/ICPC、topcoder等编程比赛获奖者优先;
3.良好的科研能力,有成果发表在TPDS、TOPC、JPDC、ICPP、CLUSTER、DISC、ISPDC、HiPC等国际顶级会议、期刊,担当一作/并列/二作;
4.作为重要角色参与领域内有含金量的比赛,如ACM、Kaggle、阿里天池大赛。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 116.207.212.*