logologo
寻找工作
返回简章2026-05-26 更新

AI Infra软硬协同预研工程师

上海
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
【岗位职责】 1. 通信库开发与调优:参与基于昇腾AI处理器的高性能集合通信库(HCCL)的研发与性能优化,针对大模型分布式训练场景,优化 AllReduce、AllGather、ReduceScatter 等核心通信原语。 2. 软硬协同优化:深入理解昇腾硬件架构与底层通信机制(如片上互联、HCCS、PCIe),通过软硬协同优化减少 Host-Device 之间的数据拷贝与同步开销,提升集群整体吞吐效率。 3. 拓扑感知与算法创新:协助研究并实现拓扑感知的通信算法,针对不同集群规模和物理组网特征,动态选择最优通信策略,以突破大规模集群下的网络通信瓶颈。 4. 分布式训练性能分析:利用昇腾通信性能分析工具(如 hccl-test、Ascend Profiler),协助定位大规模分布式训练中的通信热点与延迟瓶颈,为典型模型提供可落地的通信优化方案。 5. 前沿技术预研与生态适配:协助跟踪业界集合通信技术趋势(如 RDMA、InfiniBand 等),参与技术调研、实验验证及文档撰写,推动底层通信库的架构演进与业务场景适配。 【任职要求】 1. 基础背景:计算机、电子工程、通信、人工智能等相关专业,***本科或硕士研究生在读,可保证连续 3 个月及以上的实习周期。 2. 编程能力:具备扎实的计算机系统基础知识,熟悉操作系统与体系结构;熟练掌握 C/C++ 语言,具备良好的工程开发习惯与代码调试能力。 3. 专业知识:熟悉并行计算、分布式系统或高性能计算基本理论,对集合通信原理、RDMA 技术或主流通信库(如 NCCL、MPI)有一定了解者优先。 4. AI 背景(加分项):了解 PyTorch 等主流深度学习框架,或有 GPU/NPU 等异构计算平台开发经验者优先。 5. 软素质:对底层系统和 AI Infra 有浓厚的技术兴趣,具备优秀的逻辑思维与问题分析能力,以及良好的团队沟通协作精神。