Agent Native多模态基座模型实习生
北京·上海
电子信息类·自动化类
使用简历深度优化功能,快速提升简历质量
职位介绍
招聘部门:算法
【岗位职责】
1、参与面向物理世界 Agent 的多模态基座模型研发,覆盖视觉-语言-语音-动作相关表征的预训练、后训练与 Agentic Post-training,提升模型在感知、空间理解、规划、工具调用与行动闭环中的综合能力;
2、负责长序列与长时程任务建模,探索 context engineering、memory、tool use、planner-policy/world model 协同等核心问题,优化模型在复杂环境中的持续决策与自我修正能力;
3、构建面向物理世界 Agent 的训练数据与评测体系,围绕任务完成率、轨迹质量、空间 grounding、进度估计、错误恢复、安全性、时延与成本进行系统优化;
4、探索 Scaling Law 在 embodied / agentic 场景下的适用边界,支持下一代基座模型在架构设计、数据配比、后训练策略与推理系统上的技术决策;
5、与数据、infra、simulation、robotics 团队紧密协作,推动实验从 idea、训练、评测到集群与真实系统落地的全链路闭环。
【任职要求】
1、27届-28届毕业,计算机、人工智能、数学、机器人等相关专业,硕博优先;
2、具备扎实的深度学习基础,熟悉 Transformer、VLM/VLA/多模态 foundation model,有大模型预训练或后训练实战经验优先;
3、熟练掌握 PyTorch,具备大规模分布式训练与调试能力,熟悉 DeepSpeed、Megatron、ms-swift 等框架之一;
4、熟悉 Agent Native 相关方法与系统范式,包括但不限于:
* tool use / function calling / MCP 等工具接入机制;
* ReAct、planner-executor、orchestrator-worker、evaluator-optimizer 等 agent workflow;
* 长上下文建模、context engineering、外部记忆与 agent trace 利用;
5、具备 agent 数据构造与评测意识,能够围绕 offline benchmark、simulator-based eval、online closed-loop eval 设计指标并定位问题;
6、对物理 AI / embodied intelligence 有强烈兴趣,细读过相关代表性工作优先;
有以下经历加分:
* 物理世界 agent / VLA / world model 相关研究或项目经验;
* 大规模训练集群优化、推理系统优化经验;
* 机器人或仿真平台经验(如 Isaac、MuJoCo、ROS 等)。

