logologo
寻找工作
返回简章2025-12-03 更新

研究实习生(具身智能-多模态强化学习)

北京
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述 面向人形机器人 Locomotion与 Motion Tracking的强化学习方法研发; 设计多模态输入与奖励(视觉/触觉/机器人本体信息/传感器),探索 世界模型(World Model) 与 高效RL 的结合,提升样本效率与泛化; 将 RL 与 优化/模型控制 融合(如 MPC / WBC / 残差RL / Raibert / LIP),构建混合控制框架,提升动态稳定性与可控性; 搭建与维护仿真训练与评测基线(Isaac Gym/Isaac Lab、MuJoCo、Genesis 等),推进 sim2sim / sim2real 迁移; 参与实机部署(如 Unitree G1/H1/H1- 2、PND Adam 等),完成调试、故障定位与安全策略落地; 输出高质量的 可复现实验脚本、技术报告与文档,协助 开源/论文 产出。 任职要求 学历背景:硕士或博士在读优先(优秀本科亦可); 机器人、控制、计算机、自动化等相关专业。 理论与算法: 扎实的概率论、线性代数与优化基础; 熟悉至少一种 RL 算法(如 PPO/SAC/TD3),了解 RMA、HIM-PPO、Residual RL、Diffusion Policy/Guided Diffusion、模仿学习/运动跟踪 等之一; 理解动力学/运动学、接触建模与 MPC/WBC/LIP/Footstep Planning 至少一类。 工程与工具: 精通 Python,具备 C++ 能力加分; 熟悉至少一种仿真平台(Isaac Gym/Isaac Lab、MuJoCo、Genesis); 了解 ROS/ROS 2、Pinocchio/Drake、CasADi/OCS2 中的任意一项。 实践经验: 有多关节系统(双足/多足/机械臂)控制或模仿学习项目经历; 有 Sim2Real 或实机调试经验者优先; 能处理 IMU/力传感器/里程计 等多源数据。 软能力:自驱动、善于沟通与协作,代码规范、重视复现与文档。 加分项: 在 NeurIPS/ICLR/ICML/ICRA/RAL 等发表论文,或主导/核心贡献 高质量开源项目; 有 人形/多足 机器人运控经验(尤其 Unitree G1/H1); 熟悉 世界模型(Dreamer/RSSM)、VLM/多模态 与数据引擎构建; 了解 PBHC/Legged Gym 等足式控制框架、OCS2/MPC/WBC; 具备嵌入式/实时系统经验(CAN/RS485/BLDC)或安全/防护机制设计经验。 实习安排与发展: 周期:≥3 个月(优先 6 个月); 到岗:≥每周 4 天(≥32h); 资源:提供 GPU 训练资源(本地工作站与云服务器)与真实机器人测试机会; 发展:独立/联合署名论文/专利与开源等。