返回简章2026-05-22 更新

【26届校招】大语言模型后训练算法工程师（Foundation Model）

上海·深圳

本科及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

招聘部门：研发【岗位职责】我们正在寻找对大语言模型后训练(Post-training)整体效果调优和推理(inference)效能提升充满热情的算法工程师。您将加入我们的核心研发团队，主要负责将团队自行开发/训练的Dense & MoE 模型在后训练阶段提升通用表现(i.e. MMLU, GSM8K, Ifeval, MTBench, etc)。另外，推进监督微调（SFT）、强化学习 (LLM-RL)等架构设计与部署，以及相关基础设施（Infra）的优化。我们的目标是推出对标开源SOTA表现的自研模型，加速模型在人形机器人、自动驾驶、多模态等前沿领域的落地。工作职责： 1. LLM 微调与应用落地：负责设计并进行 LLM 的监督微调（SFT）和强化学习（如 RLHF）等实验，以提升模型在特定应用场景（如代码生成、复杂推理、对话）的表现。主导模型效果的评估体系搭建和优化，确保模型输出的准确性、安全性和一致性。 2. 云端训练框架与效率优化：主导 LLM 微调（SFT/RFT）流程在云端环境下的效率优化，包括数据加载、多机通信、资源调度、框架稳定性等方面，确保 SFT 流程的高效、稳定和低成本运行。 3. 跨团队协作：与数据和产品团队紧密合作，一同擬定交付標準，并收集应用层的反馈来指导下一轮模型迭代。【任职要求】岗位需求 1. 教育背景：计算机、人工智能、软件工程等相关专业本科及以上学位。 2. 模型实战经验：具备 LLM（如 LLaMA, GPT, Qwen 等）监督微调（SFT）、强化学习 (LLM-RL)等实务经验。 3. 核心技能： (至少熟悉以下一项) - 有实际的 LLM SFT/RLHF 等微调经验，熟悉主流的微调框架（如 verl, Trinity-RFT, Axolotl, etc）。 - 有大规模应用服务部署经验，熟悉 Kubernetes、Docker 等容器化技术。 - 有 LLM 推理服务部署和优化经验，熟悉 vLLM/SGLang/Ray Serve 等。 - 有将 LLM 应用于人形机器人或自动驾驶相关项目的经验。 4. 编程与框架：熟练掌握 Python，熟悉 PyTorch 等深度学习框架。具备良好的软件工程和代码习惯。 5. 沟通协作：具备良好的沟通和团队合作精神，能快速学习和适应新技术。

职位来源

上海小鹏汽车科技有限公司

暂无公司数据

433

在招职位