大模型芯片迁移工程师(可提前实习者优先)
北京
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述: 1.负责英伟达大模型到多元芯片的全栈迁移工作,涵盖框架适配、算子库优化及模型评测等核心环节; 2.负责大模型在多元芯片、编译器、算子库、框架上的研究与应用,从功能性、性能、易用性角度提出系统层面的设计方案并推动落地; 3.针对开源工具使用异常问题进行故障排查,输出异常信息汇总报告,并协同其他研发团队推进问题解决; 4.以提高效率和提升AI软件端到端稳定度为目标,研发基于智能体的软件。 任职要求: 1.***本科及以上学历,计算机、软件、人工智能、电子信息相关专业; 2.熟悉 Linux 环境基本命令操作,熟悉 Python 编程及 Shell 脚本使用; 3.熟悉vllm/sglang或其他推理服务框架原理,了解推理服务框架相关概念与调优方法论; 4.了解CUDA编程基本概念、DeepSeek、Qwen 等热门大模型的区别与共性,或了解 RoPE、MLA 等算法结构; 5.具备开源工具部署与使用经验,了解大模型训练、对齐、推理领域相关概念; 6.沟通能力优秀,能主动协同研发团队推进问题解决。 加分项 : 1.对非英伟达 AI 芯片有了解,具备模型迁移相关经验; 2.具备CPU/GPU硬件,编译器,操作系统,网络等基础知识,能够应用于业务异常排查与业务调优; 3.有pytorch/vllm/sglang或其他AI框架开发经验; 4.有CUDA或其他生态AI算子开发经验。 注:2026届毕业生优先,表现优异者提供校招转正机会。

