logologo
寻找工作
返回简章2026-04-01 更新

大模型推理引擎开发工程师

北京
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
角色和团队介绍: 深度挖掘国产芯片算力潜能,专注于为国产AI芯片构建强大、高效的推理软件栈。 岗位职责: 1. vLLM/SGLang深度优化与定制开发: *参与 vLLM 开源社区的新特性对vLLM-gcu进行定制化改造和功能开发。 *撰写详细的技术文档和最佳实践,赋能业务团队高效使用。 2.生态建设与模型落地 *参与开源社区建设(如vLLM/SGLang),推动GCU芯片生态与AI基础设施的融合。 *参与主流大模型在GCU上的Day-0适配,实现“发布即支持”的自动化适配工具链。 *与芯片特性结合,实现低比特硬件-aware量化工具(FP8、INT8、INT4等 )。 任职要求: *学历专业:本科及以上学历,计算机、软件工程、人工智能等相关专业; *扎实的编程功底,掌握Python/C++,有良好的数据结构和算法基础; *了解Transformer /Llama/DeepSeek/Qwen等常见模型结构; *对系统优化有浓厚兴趣,了解并行计算、CUDA编程或Triton者优先; *有vLLM/SGLang等项目实践或二次开发经验者优先; 加分项: *了解GPU架构(NVIDIA/AMD),有CUDA性能优化经验; *开源贡献:在GitHub上个人项目,或为vLLM/SGLang及其他AI开源项目提交过Issue甚至Pull Request。 *系统级思维:在课程项目或研究中,设计并实现过具有挑战性的系统级项目。 *论文发表:在MLSys、ASPLOS、OSDI等系统与机器学习交叉的顶会上发表过论文。 个人特质 *极强的技术好奇心与钻研精神:不满足于黑盒调用,渴望理解技术背后的“为什么”。 *动手能力极强:乐于动手实验,用代码和数据来验证自己的想法。 *系统思维:能够从系统(模型、算法、硬件)的角度全局性地思考性能问题。 *良好的沟通能力:能够清晰地向他人解释复杂的技术问题。 地点:北京/成都/上海/西安