您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
职位描述:
1、跟踪和研究面向大规模GPU集群的分布式系统优化技术和RDMA网络通信技术
2、配置和调优GPU-RDMA网络协议与算法以及GPU高速网络通
信库
3、负责大规模集群系统包括计算、存储、管理等网络的状态监
控、配置校验和故障定位
4、负责大规模集群的整体网络安全方案设计,并进行参与实施与证
职位要求
1、本科或本科以上学历,3-5年以上相关工作经验,计算机、通信等相关专业
2、扎实的编程能力,熟练掌握至少一种编程语言,如 C、C+
Golang 等十/
3、深刻理解高性能网络协议栈、网络处理器体系结构、数据中心网络、分布式系统等
4、熟悉集合通信、拥塞控制、流量调度、路由查找、网络校验拓扑设计等
5、熟悉 Linux 内核协议栈、DPDK、ROCEv2、NCCL、MPI.UCX等底层驱动和通信接口
所发职位不全,手上职位非常多,欢迎咨询!
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.243.*