返回简章2026-02-08 更新

【理想+】VLA多模态大模型算法(A232633)

北京

硕士及以上

电子信息类·计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述： 1. 负责跨本体VLA（Vision-Language-Action）大模型的架构设计与优化，探索多载体（车/人形/仿生平台）统一表示学习； 2. 研究多模态对齐与指令跟随技术，打通感知-语言-行动闭环，实现端到端决策能力； 3. 负责VLA大模型的预训练、指令微调、偏好对齐等训练范式探索，构建Scaling Law与评测体系； 4. 探索多模态表征与压缩、跨本体泛化等前沿问题，提升模型在不同平台的迁移能力； 5. 推动VLA模型在自动驾驶与具身智能场景的落地应用，与工程团队协作完成实车/实机部署； 6. 参与前沿研究与开源贡献，发表顶会论文，构建技术影响力。职位要求： 1. 硕士及以上学历，机器学习、NLP、多模态、计算机视觉等相关专业； 2. 扎实的深度学习基础，熟悉Transformer、多模态融合、大语言模型等技术； 3. 熟练掌握Python编程语言，熟悉PyTorch等深度学习框架，有大规模模型训练经验； 4. 对多模态大模型、VLM、VLA等技术有深入理解，紧跟学界与业界最新进展； 5. 具有优秀的分析和解决问题能力，自驱性强，能够独立推进研究项目。

职位来源

北京罗克维尔斯科技有限公司

民营企业 · 商业服务 · 成立8年

247

在招职位