logologo
寻找工作
返回简章2026-05-26 更新

大模型训推加速工程师

上海
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
职位详情 岗位描述 1。算法研发:负责模型蒸馏,量化,剪枝及稀疏技术的研究与实现,提升大模型在推理端的效率。2。知识迁移:设计高效蒸馏方案,将千亿级模型能力迁移至轻量化模型,确保精度损失最小化。3。性能优化:针对GPU,NPU进行全栈推理加速,优化算子执行逻辑,降低延迟并提升吞吐量。4。工具链开发:参与开发模型转换,自动压缩及加速工具链。 岗位要求 1。背景:计算机,数学等相关专业本硕博学历。2。核心能力(具备其一即可): 。蒸馏方向:精通知识蒸馏,模型训练策略及轻量化网络设计。 。加速方向:精通模型量化,剪枝技术,熟悉硬件架构及其加速原理。3。技术栈: 。熟练掌握PyTorch/TensorFlow,熟悉主流推理框架(如TensorRT,vLLM,DeepSpeed等).。了解主流硬件加速技术(CUDA/Triton/ARM等),有嵌入式或边缘侧优化经验者优先。4。素质:具备优秀的性能瓶颈分析能力,能针对复杂模型给出确定的优化方案。 3。软素质:具备跨团队协作能力,能在复杂不确定的业务场景中拆解目标并推动闭环。