【基座模型】场景认知算法工程师-红绿灯
北京
本科及以上
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位介绍
你将作为红绿灯及特殊场景方向的核心算法工程师,负责从 0 到 1 设计并落地面向量产的 VLA 模型,覆盖感知建模、时序架构设计、训练迭代、端侧部署、数据闭环全链路。你的工作将直接影响车辆在复杂路口和特殊场景下的认知理解与行为决策。
---
岗位职责
1. 负责红绿灯及特殊场景方向 VLA 模型的架构设计与持续迭代,包括时序建模、结构优化、多帧信息融合等关键能力建设。
2. 设计通用模型范式,提升模型对驾驶特殊场景的认知理解能力,包括但不限于收费站、可变车道、闪烁灯、复杂路口等场景。
3. 独立构建并优化完整训练 pipeline,包括数据预处理、模型训练、指标评测、仿真回灌和实车验证。
4. 设计并推进消融实验,分析时序压缩/非压缩、单帧/多帧、不同 loss 组合等方案对关键指标和业务效果的影响。
5. 负责模型在车端的推理部署与联调,排查端侧预测结果与离线训练、仿真回灌之间的精度差异,推动模型稳定量产落地。
6. 与数据团队协同完成评测集建设、标注规范制定及数据质量优化。
7. 基于众包影子回传数据定位问题,驱动数据采集、标注和问题闭环,参与影子回传数据接入方案设计。
8. 与测试、标注、工程等跨职能团队协作,推动问题从发现、定位到修复的完整闭环。
---
任职要求
硬性要求
1. 计算机、人工智能、自动化、电子信息等相关专业本科及以上学历。
2. 具备 自动驾驶感知方向工程经验,熟悉 camera-based 感知链路。
3. 熟练掌握 PyTorch,具备从头设计模型并保障训练稳定性的能力。
4. 理解 Vision Transformer(ViT)等主流视觉架构原理,能够独立设计 patch-level 特征处理、cross attention、时序建模等模块。
5. 具备独立完成端到端实验的能力,包括数据处理、模型训练、指标分析、问题归因与效果迭代。
6. 具备较强的工程实现能力和代码能力,能够独立完成模型开发、训练、调试及联调工作。
加分项
1. 有 VLA / Vision-Language / 多模态模型相关研究或工程经验。
2. 熟悉世界模型、DiT、latent diffusion 等相关方向。
3. 有特殊场景感知项目经验,如收费站、可变车道、闪烁灯、复杂交通组织场景等。
4. 有车端推理部署经验,包括量化、精度对齐、车载平台联调等。
5. 有数据闭环体系建设经验,包括影子回传、评测集构建、自动化数据产线等。
软性素质
1. 工程直觉强,能快速定位影响结果的关键问题与致命 bug。
2. 对指标和效果有高标准,不满足于离线或仿真达标,关注实车一致性。
3. 自驱力强,能在高迭代节奏下保持实验质量与交付效率。
4. 有较强的跨团队沟通协作能力,能够推动复杂问题闭环解决。
---
我们希望你具备
- 不只会“调模型”,而是能真正把模型能力做进量产链路;
- 不只关注离线指标,而是关心复杂路口场景下车辆是否真的理解并做出正确行为;
- 愿意在高复杂度、高价值、强闭环的方向上持续打磨技术。

