返回简章2026-06-18 更新

【北斗】多模态后训练及Agent能力研究员

北京

本科及以上

自动化类·计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

岗位职责我们致力于用科技创新为用户和生态伙伴创造超预期的交互体验和效率提升，依托生活服务领域多样化且复杂的业务场景，聚焦基座技术与公司战略级应用方向的深度融合，持续推动前沿技术的落地，同时积极探索和挑战技术的无人区，不断定义并刷新行业的最先进技术标准。 1、跟踪SFT/DPO/GRPO等后训练前沿方法，快速完成技术预研与可行性验证 2、面向多轮交互、长序列推理等复杂场景进行垂域数据建设与指令微调 3、建设后训练评估体系与数据飞轮，驱动评测-数据-训练闭环迭代 4、探索多模态大模型与Claude Code/OpenClaw深度结合，研究工具调用与多步规划能力边界任职要求【岗位要求】 1、对前沿技术有强烈探索欲，有出色的团队协作精神 2、有OpenClaw/Claude Code深度使用经验与产出优先 3、发表过顶级会议文章（NeurIPS/ICML/ICLR/ACL/Interspeech/ICASSP等）优先 4、ACM竞赛获奖者优先【岗位吸引力】 1、交叉前沿赛道：聚焦多模态大模型、Agent 等核心方向，探索技术边界——不只是执行，你可以主导关键技术模块的设计与落地 2、顶级研究氛围 + 充足资源保障：团队26年上半年在ICML/ICLR/ACL/EMNLP发表论文9篇，与顶尖高校长期联合研究；充足GPU集群 + Token供给，实验不被资源卡脖子 3、AI-Native 研发文化：团队把 AI 当日常工具，用它加速研究的同时，也把"怎么用好 AI"本身当作研究课题——不设条条框框，鼓励大胆尝试工作城市北京市

职位来源

北京三快在线科技有限公司

民营企业 · 互联网平台 · 成立15年

在招职位