【快Star-X实习】多模态推理引擎工程师
北京
本科及以上
电子信息类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
参与快手大模型推理引擎研发,工作内容包括:
1、参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理
2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等
3、支持RL中的多样化采样、generation性能优化等
任职要求
1、有较强的学习能力和编程能力及数学基础
2、有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者优先
3、有cuda或triton开发优化gpu算子经验者优先
4、有算力芯片优化经验者优先
5、有同领域相关实习经验者优先
参与快手大模型推理引擎研发,工作内容包括:
1、参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理
2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等
3、支持RL中的多样化采样、generation性能优化等
任职要求
1、有较强的学习能力和编程能力及数学基础
2、有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者优先
3、有cuda或triton开发优化gpu算子经验者优先
4、有算力芯片优化经验者优先
5、有同领域相关实习经验者优先


