返回简章2026-06-12 更新

AI Infra工程师

深圳

本科及以上

不限专业

使用简历深度优化功能，快速提升简历质量

职位介绍

岗位职责： 1.基于昇腾芯片和GPU芯片，研发AI 模型训练框架和RL训练框架，利用分布式训练、低精度训练等，提升训练稳定性和MFU，从而提升训练效率； 2.强化学习训练系统研发：研究端到端/大模型online/offline RL系统，在动态负载、复杂RLinf，Agent-环境交互场景下提升训练性能与稳定性； 3.探索业界领先的AI大模型压缩技术：低bit量化技术，KV Cache低bit技术，MoE/MOH等架构优化，视觉token压缩技术等，实现在端侧有限算力平台上实时运行XX B 的AI 模型； 4.基于自研端侧推理芯片，通过高性能算子优化、算子融合、通算融合等技术提升整网性能，实现端侧AI大模型实时推理，发挥模型-芯片垂直整合的独特优势。任职要求： 1.熟悉C++/CUDA/CANN编程，掌握ONNX、TensorRT模型导出与优化流程； 2.有VLA/LLM/VLM/VGGT模型（如BLIP-2、GPT-4V）推理加速经验，熟悉Attention优化技术（FlashAttention）； 3.了解模型训推服务化框架（vLLM、SGLang、VeRL/Swift、Megatron），有端侧部署（手机/边缘设备）经验者加分； 4.熟悉GPU或者NPU硬件架构，熟悉SIMD编程体系架构，有昇腾算子开发优化经验者尤佳； 5.具有系统性分析模型性能瓶颈的能力。

职位来源

华为技术有限公司

民营企业 · 计算机设备 · 成立38年

124

在招职位