【26届校招】Research Scientist (VLM 架构研发)
上海·深圳·北京
博士
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
招聘部门:研发
【岗位职责】
1. 研究与打造新一代多模态视觉语言模型(VLM),让 AI 不仅“看得懂”,还能“理解、思考与交互”。
2. 设计面向真实场景的人机交互、感知与决策系统,支持视频理解、长文本处理、跨模态信息融合等核心能力。
3. 构建高效、通用的 VLM 推理与训练架构,适配多种硬件平台(GPU/NPU/TPU/ASIC等)。
4. 探索架构创新、推理加速、模型压缩与工具调用机制,让 VLM 真正具备大规模落地与持续进化能力。
【任职要求】
1. 计算机科学、人工智能、电子工程等相关专业硕士及以上学历;
2. 在以下至少一个方向具备扎实经验:多模态模型(VLM)、推理架构优化、Transformer 加速、跨硬件部署、模型压缩/蒸馏/量化;
3. 熟悉 PyTorch 或 TensorFlow,具备良好的系统实现与实验复现能力;
4. 对大模型架构原理(如 Attention、流式推理、上下文延展等)有深入理解;
5. 拥有良好的工程能力、跨团队协作意识与创新思维。
加分项
1. 博士学历,或具备主导 VLM 架构、推理引擎优化、算子编排或推理图编译相关经验;
2. 有多模态任务(如视频理解、长文生成、视觉交互、工具调用)落地经验;
3. 在 NeurIPS、ICML、CVPR 等顶会上发表过论文,或拥有专利 / 技术创新成果;
4. 在开源社区(如 Hugging Face、vLLM、LangChain、OpenDevin 等)有实际贡献或影响力;
5. 具备解决复杂开放式技术问题的能力,能够灵活整合多种技术路线,并推动从研究到产品的落地转化。

