logologo
寻找工作
返回简章2026-06-30 更新

软件开发工程师(未来领军)

深圳·西安·上海...
硕士及以上
计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责
负责以下一项或多项:
1、大模型训推底层系统研发
负责 AI 编译器后端适配、算子库开发,完成 vLLM、Megatron 等训推框架定制优化;搭建智算平台 SDK、集群调度与性能分析工具;优化 NCCL/RDMA 分布式通信、显存及存储 I/O,全方位提升集群算力使用效率。
2、AI 硬件与超节点基础设施系统设计
参与芯片仿真、驱动到上层应用全流程工程落地;开展新型 GPU、超节点 AI 基础设施研发,从系统层面优化推理速度、算力利用率。
3、AI Agent 全栈架构与行业应用开发
设计 AI Agent 整体架构,开发记忆、知识库、工具 Skills 核心模块,落地代码生成、缺陷分析等研发场景;实现 RAG 检索、向量检索、工具调用能力,沉淀通用 Agent 组件框架;负责 Agent 性能调优、稳定性保障及研发工具链集成,同步跟进前沿技术驱动产品迭代。
4、大规模智算高性能网络研发
研究智算基础网络核心技术,设计大规模集群网络管控、性能调优、智能运维框架;开展高性能网卡、DPU、GPU 驱动开发,实现 RoCE/RDMA/CCL 通信协议,搭建软件生态。
5、智算高性能分布式存储产品研发
基于 NVME、RDMA 技术研发高带宽、高 IOPS 智算存储系统,攻坚 KVCache 性能优化;掌握分布式存储协议,适配大模型训推海量数据存取场景。
6、RISC-V 架构存储软硬件适配调测
基于 RISC-V 指令集体系完成存储硬件、固件开发与整机调优,打通底层算力存储软硬件协同链路,支撑智算集群国产化基础设施落地。

任职要求
1、计算机、人工智能、软件工程等相关专业,硕士及以上学历;
2、精通C/C++/Python/Java,熟悉Linux环境;
3、精通PyTorch/TensorFlow,了解DeepSpeed/Megatron/vLLM等训推框架源码; 了解Agent架构、RAG、向量数据库等技术;有相关项目经验优先;
4、熟悉LLVM/MLIR/TVM,了解GPU/NPU体系结构;
5、熟悉分布式系统、K8s、RDMA,有高性能计算或性能优化经验,具备强大的工程实现能力和系统调优能力;
6、熟悉大模型数据并行与集合通讯原理,熟悉主流网卡/DPU软硬件架构,有网卡驱动开发经验者优先。熟悉NVME、RDMA、KVCache、RISC-V技术者优先。熟悉智算无损网络拥塞控制、负载均衡等算法者优先。