返回简章2026-03-06 更新

深度学习模型部署与优化工程师

北京

硕士及以上

自动化类·计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

岗位职责 · 负责将深度学习算法模型（包括视觉、语音、多模态及大模型）在嵌入式智能芯片（如ARM、Jetson系列、NPU）及AI加速卡（如GPU）上进行移植、部署与性能优化。 · 深入模型压缩技术的研究与应用，包括但不限于量化（INT8/low-bit）、剪枝、蒸馏、网络结构搜索等，以提升模型在边缘设备上的运行效率。 · 利用并行计算框架（如CUDA、OpenCL）与高性能编程技术（多线程、向量化指令），对模型推理过程进行极致优化，充分挖掘硬件算力。 · 协同算法与硬件团队，完成模型的转换、编译与部署，并负责在真实场景中进行性能分析与瓶颈定位。 · 跟踪业界前沿的模型部署与优化技术（如TensorRT、OpenVINO、ONNX Runtime等），并将其应用于实际产品，提升产品竞争力。任职要求· 硕士及以上学历，计算机、电子工程、自动化、应用数学等相关专业。 · 具备扎实的C++编程能力和良好的编程习惯，熟悉Python，了解Linux开发环境。 · 熟悉主流深度学习框架（PyTorch、TensorFlow）及其模型导出和部署流程。 · 深入理解模型压缩与加速原理，对至少一种量化、剪枝或蒸馏技术有实际的项目经验。 · 具备在嵌入式平台（如NVIDIA Jetson、ARM架构芯片）或AI加速卡（GPU）上部署和优化深度学习模型的实践经验。 · 熟悉至少一种以下技术栈：CUDA编程、OpenCL、ARM NEON指令集，或熟悉TensorRT、OpenVINO、ONNX Runtime等任一推理引擎。优先考虑 · 熟悉大模型（LLM）或视觉大模型（VLM）的推理加速技术（如Speculative Decoding、vLLM、FlashAttention等）及相关工具链。 · 有AI芯片原厂（如NVIDIA、Intel、海思、寒武纪等）或AI Infra公司的实习或项目经验。 · 在高性能计算、模型部署优化等相关领域的顶级会议或竞赛（如CVPR、ICML、NeurIPS）中有论文发表或获奖经历。 · 了解计算机体系结构，具备性能分析工具（如Nsight Systems、perf）的使用经验，能精准定位性能瓶颈。

职位来源

北京电子工程总体研究所

暂无公司数据

在招职位