AI Infra Intern
上海
硕士及以上
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
【团队职责】: 主要工作内容为定义和解决围绕LLM推理/训练加速,网络通信和数据传输优化等方面的计算问题。工作地点为北京或者上海。
【岗位职责和工作方向】
1.对开源推理框架例如SGLang/vLLM的深入理解和开发,与社区合作进行功能/算子开发,性能优化,模型支持等工作。
2.对LLM场景中的kvcache offloading框架的开发和性能优化,支持cpu/ssd/远程存储等多级kvcache 卸载重用,加速推理。(团队项目:https://github.com/taco-project/FlexKV)
3.负责分布式训练中计算性能相关的研发工作,持续探索和计算性能优化相关的方法与技术
4.深入研究机器学习中的计算问题,归纳总结普遍存在的计算问题和需求,开发相应的示例代码,加速库,或者框架。
【岗位要求:
1.对加速计算、并行计算、异构计算感兴趣,愿意在这些方向上持续深入探索。
2.电子、自动化、计算机、计算数学等相关专业,硕士及以上学历。
3.较强的编程基础。熟悉数据结构和计算机系统的一般概念。
4.较强的学习能力和适应能力。较强的分析问题、定义问题和自主探索的能力。
【加分项】
1.熟悉异构计算、分布式训练、并行计算、或其他高性能计算方向。
2.有性能分析,性能模型,或性能优化背景和经验,有开源框架的贡献经验。
3. 本职位需要较强的新问题定义,和解决方案探索能力,因此优先考虑经过博士阶段独立科研训
练的博士生同学。
4. 熟练使用 AI 编程工具。

