logologo
寻找工作
返回简章2026-02-25 更新

ai推理框架研发工程师

深圳
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位介绍:开发和维护AI大模型推理框架,以提供高吞吐、低时延的大模型推理服务,包括以下方向: 1. 推理模型开发:面向推理服务应用,开发、适配和优化Qwen3、DeepSeek-R1、GLM-4.5等SOTA大模型; 2. 模型小型化:使用量化、剪枝、蒸馏等算法,让大模型“轻装上阵”; 3. 分布式并行策略开发: 设计实现大模型推理的并行计算与资源调度策略,构建高可用、高可靠的智算系统; 4. 软硬件协同优化:深耕算子开发与性能调优,榨取NPU、GPU、CPU算力的“最后一滴果汁”。 寻找这样的伙伴: 1. 熟练使用Python/C++/C等任一编程语言; 2. 熟悉PyTorch/TensorFlow/MindSpore/PaddlePaddle等任一一种AI框架,有CUDA、OpenCL经验更佳; 3. 理解CNN/Transformers等AI基础理论,有vLLM、SGLang、xDiT等大模型训推项目经验,或熟悉并行解码、稀疏计算、量化算法更佳; 4. 热爱技术攻坚,具备独立解决复杂问题能力; 5. 26年应届毕业生,或本科大二以上、研究生研一/博一以上实习生。 地点: 北京(环保园/华为大厦)、上海(练秋湖)、杭州、深圳(坂田)