返回简章2026-06-12 更新

AI Infra Intern

上海

硕士及以上

自动化类·计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

【团队职责】: 主要工作内容为定义和解决围绕LLM推理/训练加速，网络通信和数据传输优化等方面的计算问题。工作地点为北京或者上海。【岗位职责和工作方向】 1.对开源推理框架例如SGLang/vLLM的深入理解和开发，与社区合作进行功能/算子开发，性能优化，模型支持等工作。 2.对LLM场景中的kvcache offloading框架的开发和性能优化，支持cpu/ssd/远程存储等多级kvcache 卸载重用，加速推理。（团队项目：https://github.com/taco-project/FlexKV） 3.负责分布式训练中计算性能相关的研发工作，持续探索和计算性能优化相关的方法与技术 4.深入研究机器学习中的计算问题，归纳总结普遍存在的计算问题和需求，开发相应的示例代码，加速库，或者框架。【岗位要求： 1.对加速计算、并行计算、异构计算感兴趣，愿意在这些方向上持续深入探索。 2.电子、自动化、计算机、计算数学等相关专业，硕士及以上学历。 3.较强的编程基础。熟悉数据结构和计算机系统的一般概念。 4.较强的学习能力和适应能力。较强的分析问题、定义问题和自主探索的能力。【加分项】 1.熟悉异构计算、分布式训练、并行计算、或其他高性能计算方向。 2.有性能分析，性能模型，或性能优化背景和经验，有开源框架的贡献经验。 3. 本职位需要较强的新问题定义，和解决方案探索能力，因此优先考虑经过博士阶段独立科研训练的博士生同学。 4. 熟练使用 AI 编程工具。

职位来源

英伟达半导体科技(上海)有限公司

外企 · 计算机零部件制造 · 成立21年

在招职位