AI算法工程师(未来领军)
三亚·北京·武汉...
硕士及以上
计算机类·数学类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责
1、跟踪并实现LLM、多模态、MoE等前沿算法,优化模型架构与训练方法,探索Agentic AI等新技术;
2、负责大模型(预训练、微调、RLHF)及高性能推理系统的全链路研发,包括分布式训推框架优化(DeepSpeed/Megatron/vLLM/SGLang)、高性能算子库开发及KV Cache等内存架构创新;
3、设计万卡级智算集群架构,优化异构算力调度、高性能网络(RDMA)及分布式存储,提升算力利用率和训推效率;
4、负责智算基础网络技术的研究与实现,研发大规模智算网络拓扑的管控机制、性能调优算法、智能运维框架等;
5、负责智算网络高性能网卡/DPU/GPU硬件的驱动研发,开发TCP/IP、RoCE、RDMA、CCL集合通讯库等协议,以及类DOCA/CUDA生态系统;
6、推动大模型及AI Agent在通信网络(AI-RAN)、智能运维(AIOps)、具身智能、自动驾驶、新能源消纳、电力市场交易等核心场景的产品化落地。
任职要求
1、计算机、人工智能、通信、数学等相关专业,硕士及以上学历;
2、精通Python/C++,熟练使用PyTorch/TensorFlow,掌握DeepSpeed/Megatron/vLLM/SGLang等分布式训练框架及vLLM/SGLang等推理框架;
3、深入理解Transformer架构及大模型原理,具备模型预训练、微调、RLHF经验,熟悉模型压缩(量化/剪枝/蒸馏);
4、了解智算集群架构,熟悉K8s、RDMA、CUDA,有AI编译器或高性能算子开发经验者优先;
5、熟悉Agent开发框架及RAG技术,具备极强的技术洞察力、学习能力与成就导向,有顶会论文、竞赛获奖或大型项目经验者优先;
6、熟悉大模型数据并行与集合通讯原理,熟悉NVLink/CLOS/Dragonfly等组网协议,熟悉智算无损网络拥塞控制、负载均衡等算法者优先;
7、熟悉Mellanox ConnectX/BlueField系列等主流网卡/DPU软硬件架构,有网卡驱动开发经验者优先。
1、跟踪并实现LLM、多模态、MoE等前沿算法,优化模型架构与训练方法,探索Agentic AI等新技术;
2、负责大模型(预训练、微调、RLHF)及高性能推理系统的全链路研发,包括分布式训推框架优化(DeepSpeed/Megatron/vLLM/SGLang)、高性能算子库开发及KV Cache等内存架构创新;
3、设计万卡级智算集群架构,优化异构算力调度、高性能网络(RDMA)及分布式存储,提升算力利用率和训推效率;
4、负责智算基础网络技术的研究与实现,研发大规模智算网络拓扑的管控机制、性能调优算法、智能运维框架等;
5、负责智算网络高性能网卡/DPU/GPU硬件的驱动研发,开发TCP/IP、RoCE、RDMA、CCL集合通讯库等协议,以及类DOCA/CUDA生态系统;
6、推动大模型及AI Agent在通信网络(AI-RAN)、智能运维(AIOps)、具身智能、自动驾驶、新能源消纳、电力市场交易等核心场景的产品化落地。
任职要求
1、计算机、人工智能、通信、数学等相关专业,硕士及以上学历;
2、精通Python/C++,熟练使用PyTorch/TensorFlow,掌握DeepSpeed/Megatron/vLLM/SGLang等分布式训练框架及vLLM/SGLang等推理框架;
3、深入理解Transformer架构及大模型原理,具备模型预训练、微调、RLHF经验,熟悉模型压缩(量化/剪枝/蒸馏);
4、了解智算集群架构,熟悉K8s、RDMA、CUDA,有AI编译器或高性能算子开发经验者优先;
5、熟悉Agent开发框架及RAG技术,具备极强的技术洞察力、学习能力与成就导向,有顶会论文、竞赛获奖或大型项目经验者优先;
6、熟悉大模型数据并行与集合通讯原理,熟悉NVLink/CLOS/Dragonfly等组网协议,熟悉智算无损网络拥塞控制、负载均衡等算法者优先;
7、熟悉Mellanox ConnectX/BlueField系列等主流网卡/DPU软硬件架构,有网卡驱动开发经验者优先。


