大模型推理加速工程师(可灵Infra-春招)
北京
本科及以上
电子信息类·自动化类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
1、和领域内最顶尖的算法工程师合作,一起研发业内领先的大模型推理优化方案,优化目标包括但不限于视频生成大模型、多模态大模型;
2、调研大模型推理优化方向最新论文,方向包括但不限于高性能算子开发、大模型量化、分布式大模型并行推理、投机推理等。
任职要求
1、计算机相关专业,熟悉Linux开发环境,熟练掌握 Python编程语言,熟悉常见算法与数据结构;
2、熟悉深度学习相关基础知识和常见大模型推理优化技术;
3、具有良好的团队合作精神和沟通能力,积极乐观、具备抗压能力、自驱能力。
加分项
1、有Nvidia GPU 算子开发经验者优先;
2、熟悉常见大模型并行推理方案,有使用vllm、SGlang、TensorRT-LLM、xDIT等开源框架经验者优先;
3、在 ICLR、NeurIPS、ICML 等顶会发表过相关论文。

