【理想+】VLA多模态大模型算法(A232633)
北京
硕士及以上
电子信息类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述: 1. 负责跨本体VLA(Vision-Language-Action)大模型的架构设计与优化,探索多载体(车/人形/仿生平台)统一表示学习; 2. 研究多模态对齐与指令跟随技术,打通感知-语言-行动闭环,实现端到端决策能力; 3. 负责VLA大模型的预训练、指令微调、偏好对齐等训练范式探索,构建Scaling Law与评测体系; 4. 探索多模态表征与压缩、跨本体泛化等前沿问题,提升模型在不同平台的迁移能力; 5. 推动VLA模型在自动驾驶与具身智能场景的落地应用,与工程团队协作完成实车/实机部署; 6. 参与前沿研究与开源贡献,发表顶会论文,构建技术影响力。 职位要求: 1. 硕士及以上学历,机器学习、NLP、多模态、计算机视觉等相关专业; 2. 扎实的深度学习基础,熟悉Transformer、多模态融合、大语言模型等技术; 3. 熟练掌握Python编程语言,熟悉PyTorch等深度学习框架,有大规模模型训练经验; 4. 对多模态大模型、VLM、VLA等技术有深入理解,紧跟学界与业界最新进展; 5. 具有优秀的分析和解决问题能力,自驱性强,能够独立推进研究项目。

