logologo
寻找工作
返回简章2026-03-06 更新

深度学习模型部署与优化工程师

北京
硕士及以上
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责 · 负责将深度学习算法模型(包括视觉、语音、多模态及大模型)在嵌入式智能芯片(如ARM、Jetson系列、NPU)及AI加速卡(如GPU) 上进行移植、部署与性能优化。 · 深入模型压缩技术的研究与应用,包括但不限于量化(INT8/low-bit)、剪枝、蒸馏、网络结构搜索等,以提升模型在边缘设备上的运行效率。 · 利用并行计算框架(如CUDA、OpenCL) 与高性能编程技术(多线程、向量化指令),对模型推理过程进行极致优化,充分挖掘硬件算力。 · 协同算法与硬件团队,完成模型的转换、编译与部署,并负责在真实场景中进行性能分析与瓶颈定位。 · 跟踪业界前沿的模型部署与优化技术(如TensorRT、OpenVINO、ONNX Runtime等),并将其应用于实际产品,提升产品竞争力。任职要求· 硕士及以上学历,计算机、电子工程、自动化、应用数学等相关专业。 · 具备扎实的C++编程能力和良好的编程习惯,熟悉Python,了解Linux开发环境。 · 熟悉主流深度学习框架(PyTorch、TensorFlow)及其模型导出和部署流程。 · 深入理解模型压缩与加速原理,对至少一种量化、剪枝或蒸馏技术有实际的项目经验。 · 具备在嵌入式平台(如NVIDIA Jetson、ARM架构芯片)或AI加速卡(GPU) 上部署和优化深度学习模型的实践经验。 · 熟悉至少一种以下技术栈:CUDA编程、OpenCL、ARM NEON指令集,或熟悉TensorRT、OpenVINO、ONNX Runtime等任一推理引擎。 优先考虑 · 熟悉大模型(LLM)或视觉大模型(VLM) 的推理加速技术(如Speculative Decoding、vLLM、FlashAttention等)及相关工具链。 · 有AI芯片原厂(如NVIDIA、Intel、海思、寒武纪等)或AI Infra公司的实习或项目经验。 · 在高性能计算、模型部署优化等相关领域的顶级会议或竞赛(如CVPR、ICML、NeurIPS)中有论文发表或获奖经历。 · 了解计算机体系结构,具备性能分析工具(如Nsight Systems、perf)的使用经验,能精准定位性能瓶颈。