VLA/VLM算法实习生
上海·广州·北京...
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
招聘部门:算法
【岗位职责】
1、参与视觉-语言-动作(VLA)多模态大模型的研发与迭代,提升模型在自动驾驶场景中的感知、推理与决策能力;
2、探索端到端自动驾驶架构,打通从传感器输入到控制输出的全链路学习;
3、优化VLM大模型的物理世界理解能力,支持开放词汇检测、场景描述与空间推理;
4、研究VLA与自驾Planning模块的融合方案,推动从预测轨迹到可执行动作的可靠映射;
5、与工程团队紧密协作,支持模型在车端的高效部署与在线验证。
【任职要求】
1、27届-28届毕业同学,计算机/人工智能/机器人等相关专业,硕博优先;
2、扎实的深度学习基础,熟悉Transformer、ViT、LLaMA等主流架构,具备多模态模型训练经验;
3、熟练掌握PyTorch,有大规模模型训练与调优的实战经验;
4、有RT-2、OpenVLA、PaLM-E等VLA模型研究或复现经验,或参与过端到端自动驾驶项目(如UniAD、VAD、FusionAD)优先;
5、熟悉GPT-4V、LLaVA、Qwen-VL等视觉语言模型,有指令微调、RLHF经验者优先;
6、有自驾Planning经验,熟悉基于学习或优化的规划方法(模仿学习、模型预测控制、图搜索),有实车或仿真验证经验者优先。

