返回简章2026-05-22 更新

【26届校招】强化学习分布式系统工程师

上海

硕士及以上

自动化类·计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

招聘部门：研发【岗位职责】 1. 与电动车动力系统团队深度合作，设计并实现适用于车载动力系统效率优化的强化学习（RL）算法。 2. 利用或基于 Ray-RLlib, rsl_rl, 或 stable-baselines3 等主流框架，搭建高效、分布式的RL训练与部署架构。 3. 推动RL控制策略的sim2real 迁移，并参与小鹏汽车动力系统硬件在环或实车平台的集成与调试工作。 4. 作为AI团队与动力系统部门之间的核心桥梁，负责需求对齐、数据接口规范化和联合调试。 5. 根据业务需求，未来有机会参与 LLM团队针对语言模型后训练RL 框架的搭建与优化。【任职要求】 1. 硕士及以上学历，具有机器人、运动控制、自动化、人工智能、计算机等相关背景。 2. 有强化学习（RL）相关产品落地实务经验优先。 3. 扎实的强化学习理论基础，熟悉主流离线/在线RL算法(e.g. PPO, SAC, etc)，并具备实际项目应用经验。 4. 精通至少一个主流RL框架，如 Ray-RLlib (精通Ray 加分), rsl_rl, stable-baselines3, 或 rl-games 等。 5. 精通 Python，PyTorch，並具备良好的代码组织和工程化能力，熟悉C++ 加分。 6. 具备优秀的跨部门沟通与协作能力，能有效推动项目落地。加分项： - 熟悉运动控制、动力学建模、或车辆动力学相关知识者优先。 - 对 LLM-RFT 有浓厚兴趣，并乐于参与前沿技术框架(e.g. VERL, Trinity-RFT, etc)的搭建与探索。

职位来源

上海小鹏汽车科技有限公司

暂无公司数据

433

在招职位