返回简章2026-05-22 更新

VLM Research Intern

深圳·上海

硕士及以上

电子信息类·自动化类

使用简历深度优化功能，快速提升简历质量

职位介绍

招聘部门：互联网 / 电子 / 网游【岗位职责】 1、负责大模型 VLM: Vision-Language Model在人形机器人中的算法设计与开发，将VLM应用于人形机器人的对话、环境感知与人机交互任务； 2、参与大模型的Pretrain与Mid-training（long-context training），并利用数据合成技术打造高质量的预训练/后训练数据集； 3、与机器人平台团队、硬件团队紧密协作，实现模型在实际机器人系统中的高效运行； 4、跟踪前沿研究，推动新技术在产品中的落地应用。【任职要求】 1、计算机、人工智能、自动化等相关专业硕士及以上学历； 2、具备扎实的深度学习基础，熟悉Transformer、BERT、ViT、CLIP等主流视觉-语言模型架构； 3、有大模型 VLM 的训练/微调/推理优化经验，熟悉其在多模态任务中的应用； 4、熟练使用Pytorch深度学习框架，具备良好的工程能力和代码实现能力； 5、良好的团队协作与沟通能力，具备快速学习和解决问题的能力。【加分项】 1、有使用大语言模型进行数据合成（Data synthesis）的相关经验； 2、对大语言模型的预训练/后训练数据集有一定了解，有处理Trillion级别数据集的相关经验； 3、有参与实际LLM预训练或后训练的相关项目经验； 4、熟悉开源大模型生态（如Qwen, Llama等），对大模型的模型结构优化（如linear attention，Mixture-of-Expert等）有一定了解； 5、有参与ViT预训练或后训练的相关项目经验，有多模态大规模数据集的处理经验； 6、有在 CVPR、ICCV、NeurIPS 等人工智能/计算机视觉/机器学习顶级会议发表论文的经历。

职位来源

上海小鹏汽车科技有限公司

暂无公司数据

433

在招职位