大模型推理加速算法工程师
上海
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责
1. 根据芯片特性,例如量化、稀疏、Winograd等,设计和开发NN量化压缩工具;
2. 负责大模型量化压缩工具的设计和开发,参与端侧大模型落地交付;
3. 协同业务算法团队,持续优化工具痛点,提升工具效能。
任职要求
1. 本科硕士及以上学历;
2. 具备量化/稀疏/Winograd等硬件加速方案的工具开发经验;
3. 具备以下开发和研究经验者优先:熟悉QAT工具的设计和开发,熟悉编译器量化方案,熟悉大模型量化工具,熟悉业界主流大模型量化方案;
4. 具备以下开发和研究经验者优先:NNCF/TensorRT/SNPE/AIMET/PPQ等量化工具开发经验,CEVA/TI/高通等DSP上算法部署,AMD/Adreno/Mali等GPU上算法部署,CUDA/Triton优化;
5. 逻辑清晰,学习能力强,具备良好沟通、团队协作能力和技术项目管理能力。

