logologo
寻找工作
返回简章2026-04-17 更新

大模型推理加速工程师(可灵Infra-春招)

北京
本科及以上
电子信息类·自动化类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述 1、和领域内最顶尖的算法工程师合作,一起研发业内领先的大模型推理优化方案,优化目标包括但不限于视频生成大模型、多模态大模型; 2、调研大模型推理优化方向最新论文,方向包括但不限于高性能算子开发、大模型量化、分布式大模型并行推理、投机推理等。 任职要求 1、计算机相关专业,熟悉Linux开发环境,熟练掌握 Python编程语言,熟悉常见算法与数据结构; 2、熟悉深度学习相关基础知识和常见大模型推理优化技术; 3、具有良好的团队合作精神和沟通能力,积极乐观、具备抗压能力、自驱能力。 加分项 1、有Nvidia GPU 算子开发经验者优先; 2、熟悉常见大模型并行推理方案,有使用vllm、SGlang、TensorRT-LLM、xDIT等开源框架经验者优先; 3、在 ICLR、NeurIPS、ICML 等顶会发表过相关论文。