logologo
寻找工作
返回简章2026-05-26 更新

大模型推理加速算法工程师

上海
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责 1. 根据芯片特性,例如量化、稀疏、Winograd等,设计和开发NN量化压缩工具; 2. 负责大模型量化压缩工具的设计和开发,参与端侧大模型落地交付; 3. 协同业务算法团队,持续优化工具痛点,提升工具效能。 任职要求 1. 本科硕士及以上学历; 2. 具备量化/稀疏/Winograd等硬件加速方案的工具开发经验; 3. 具备以下开发和研究经验者优先:熟悉QAT工具的设计和开发,熟悉编译器量化方案,熟悉大模型量化工具,熟悉业界主流大模型量化方案; 4. 具备以下开发和研究经验者优先:NNCF/TensorRT/SNPE/AIMET/PPQ等量化工具开发经验,CEVA/TI/高通等DSP上算法部署,AMD/Adreno/Mali等GPU上算法部署,CUDA/Triton优化; 5. 逻辑清晰,学习能力强,具备良好沟通、团队协作能力和技术项目管理能力。