MiMo顶尖应届-大模型推理框架研发工程师
北京
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
1、负责基于 SGLang 等技术的大模型推理框架的开发工作,包括但不限于设计和实现高效的推理引擎架构,优化推理过程中的计算流程,提高推理性能。以满足不同规模大模型的实时推理需求
复杂大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能。
2、负责Cuda Kernel优化,开发高性能的GPU算子, 提升大模型推理性能。
职位要求
1、计算机/电子/数学等相关专业硕士及以上学历;
2、精通C/C++,熟悉Python,具备扎实的数据结构与算法基础,ACM/ICPC、NOI等竞赛获奖者优先;
3、熟悉NVIDIA GPU架构及编程模型,掌握CUDA核函数优化、显存管理、多流并发等技术,有实际性能调优经验;
4、熟悉PyTorch、Megatron、vLLM/SGLang等深度学习训练和推理框架;
5、有分布式系统开发经验,熟悉MPI、NCCL等通信库,或参与过大模型训练/推理项目者优先。

