返回简章2025-12-03 更新

研究实习生(具身智能-多模态强化学习)

北京

硕士及以上

不限专业

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述面向人形机器人 Locomotion与 Motion Tracking的强化学习方法研发；设计多模态输入与奖励（视觉/触觉/机器人本体信息/传感器），探索世界模型（World Model）与高效RL 的结合，提升样本效率与泛化；将 RL 与优化/模型控制融合（如 MPC / WBC / 残差RL / Raibert / LIP），构建混合控制框架，提升动态稳定性与可控性；搭建与维护仿真训练与评测基线（Isaac Gym/Isaac Lab、MuJoCo、Genesis 等），推进 sim2sim / sim2real 迁移；参与实机部署（如 Unitree G1/H1/H1- 2、PND Adam 等），完成调试、故障定位与安全策略落地；输出高质量的可复现实验脚本、技术报告与文档，协助开源/论文产出。任职要求学历背景：硕士或博士在读优先（优秀本科亦可）；机器人、控制、计算机、自动化等相关专业。理论与算法：扎实的概率论、线性代数与优化基础；熟悉至少一种 RL 算法（如 PPO/SAC/TD3），了解 RMA、HIM-PPO、Residual RL、Diffusion Policy/Guided Diffusion、模仿学习/运动跟踪等之一；理解动力学/运动学、接触建模与 MPC/WBC/LIP/Footstep Planning 至少一类。工程与工具：精通 Python，具备 C++ 能力加分；熟悉至少一种仿真平台（Isaac Gym/Isaac Lab、MuJoCo、Genesis）；了解 ROS/ROS 2、Pinocchio/Drake、CasADi/OCS2 中的任意一项。实践经验：有多关节系统（双足/多足/机械臂）控制或模仿学习项目经历；有 Sim2Real 或实机调试经验者优先；能处理 IMU/力传感器/里程计等多源数据。软能力：自驱动、善于沟通与协作，代码规范、重视复现与文档。加分项：在 NeurIPS/ICLR/ICML/ICRA/RAL 等发表论文，或主导/核心贡献高质量开源项目；有人形/多足机器人运控经验（尤其 Unitree G1/H1）；熟悉世界模型（Dreamer/RSSM）、VLM/多模态与数据引擎构建；了解 PBHC/Legged Gym 等足式控制框架、OCS2/MPC/WBC；具备嵌入式/实时系统经验（CAN/RS485/BLDC）或安全/防护机制设计经验。实习安排与发展：周期：≥3 个月（优先 6 个月）；到岗：≥每周 4 天（≥32h）；资源：提供 GPU 训练资源（本地工作站与云服务器）与真实机器人测试机会；发展：独立/联合署名论文/专利与开源等。

职位来源

北京智源人工智能研究院

民营企业

在招职位