【校招】推理优化工程师
厦门
硕士及以上
计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述:
1、负责构建大模型推理引擎,优化多模态生成大模型在GPU集群上的推理性能,实现低延迟、高吞吐的工业级部署;
2、负责模型推理性能优化,涵盖CUDA/Triton算子开发、vLLM/SGLang框架升级、分布式推理策略优化、量化/稀疏化等模型Efficiency加速优化等;
3、研发GPU推理加速技术栈,考虑最佳分布式通算结合方案,PCIe通信与高并发推理架构;
4、负责高性能方案前瞻性建设,构建基于C++/python研发的高性能推理系统;
5、与客户业务深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署大模型,支持AI工具链和技术生态建设。
职位要求:
1、硕士及以上学位,计算机相关专业优先;
2、精通Python,熟悉C++特性,具备高性能代码开发能力和相关经验;
3、具备以下项目之一:GPU编程(CUDA/Triton/AscendC/TileLang开发)、模型量化/稀疏化/蒸馏、基于vLLM的框架研发,并行计算的通算结合(多卡/多机推理优化);
4、符合以下条件者优先:大规模推理系统经验,vLLM/SGLang开发,Tilelang/Tritton开发,深入了解Transformer架构,有量化/稀疏化等相关技术落地或者论文发表等相关经验。

