logologo
寻找工作
返回简章2026-06-12 更新

AI Infra Intern

上海
硕士及以上
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
【团队职责】: 主要工作内容为定义和解决围绕LLM推理/训练加速,网络通信和数据传输优化等方面的计算问题。工作地点为北京或者上海。 【岗位职责和工作方向】 1.对开源推理框架例如SGLang/vLLM的深入理解和开发,与社区合作进行功能/算子开发,性能优化,模型支持等工作。 2.对LLM场景中的kvcache offloading框架的开发和性能优化,支持cpu/ssd/远程存储等多级kvcache 卸载重用,加速推理。(团队项目:https://github.com/taco-project/FlexKV) 3.负责分布式训练中计算性能相关的研发工作,持续探索和计算性能优化相关的方法与技术 4.深入研究机器学习中的计算问题,归纳总结普遍存在的计算问题和需求,开发相应的示例代码,加速库,或者框架。 【岗位要求: 1.对加速计算、并行计算、异构计算感兴趣,愿意在这些方向上持续深入探索。 2.电子、自动化、计算机、计算数学等相关专业,硕士及以上学历。 3.较强的编程基础。熟悉数据结构和计算机系统的一般概念。 4.较强的学习能力和适应能力。较强的分析问题、定义问题和自主探索的能力。 【加分项】 1.熟悉异构计算、分布式训练、并行计算、或其他高性能计算方向。 2.有性能分析,性能模型,或性能优化背景和经验,有开源框架的贡献经验。 3. 本职位需要较强的新问题定义,和解决方案探索能力,因此优先考虑经过博士阶段独立科研训 练的博士生同学。 4. 熟练使用 AI 编程工具。