返回简章2026-04-01 更新

大模型推理引擎开发工程师

北京

本科及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

角色和团队介绍：深度挖掘国产芯片算力潜能，专注于为国产AI芯片构建强大、高效的推理软件栈。岗位职责： 1. vLLM/SGLang深度优化与定制开发： *参与 vLLM 开源社区的新特性对vLLM-gcu进行定制化改造和功能开发。 *撰写详细的技术文档和最佳实践，赋能业务团队高效使用。 2.生态建设与模型落地 *参与开源社区建设（如vLLM/SGLang），推动GCU芯片生态与AI基础设施的融合。 *参与主流大模型在GCU上的Day-0适配，实现“发布即支持”的自动化适配工具链。 *与芯片特性结合，实现低比特硬件-aware量化工具（FP8、INT8、INT4等）。任职要求： *学历专业：本科及以上学历，计算机、软件工程、人工智能等相关专业； *扎实的编程功底，掌握Python/C++，有良好的数据结构和算法基础； *了解Transformer /Llama/DeepSeek/Qwen等常见模型结构； *对系统优化有浓厚兴趣，了解并行计算、CUDA编程或Triton者优先； *有vLLM/SGLang等项目实践或二次开发经验者优先；加分项： *了解GPU架构（NVIDIA/AMD），有CUDA性能优化经验； *开源贡献：在GitHub上个人项目，或为vLLM/SGLang及其他AI开源项目提交过Issue甚至Pull Request。 *系统级思维：在课程项目或研究中，设计并实现过具有挑战性的系统级项目。 *论文发表：在MLSys、ASPLOS、OSDI等系统与机器学习交叉的顶会上发表过论文。个人特质 *极强的技术好奇心与钻研精神：不满足于黑盒调用，渴望理解技术背后的“为什么”。 *动手能力极强：乐于动手实验，用代码和数据来验证自己的想法。 *系统思维：能够从系统（模型、算法、硬件）的角度全局性地思考性能问题。 *良好的沟通能力：能够清晰地向他人解释复杂的技术问题。地点：北京/成都/上海/西安

职位来源

上海燧原科技股份有限公司

民营企业 · 人工智能硬件 · 成立8年

在招职位