logologo
寻找工作
返回简章2026-06-03 更新

CV算法工程师(J18307)

北京·廊坊
博士
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责 1、多模态算法研发与落地:以多模态大模型(LMM/VLM)为核心,负责面向实际业务构建算法流程,端到端地完成技术方案的产品化落地。负责核心多模态大模型的算法优化,解决生成质量、多样性、可控性及采样效率等问题,特别是面向图像/视频生成模型。 2、视觉感知与能力构建:负责关键模型的能力构建,优化各类视觉感知类模型(如目标检测、3D空间理解)的精度、性能及泛化能力,最终满足业务需求。融合前沿学术成果(如CLIP、BLIP、LLaVA等),构建差异化和有竞争力的创新产品。 3、技术攻关与方案设计:深入理解业务需求,结合前沿AI技术(CV、VLM、具身智能等),设计并输出面向工业场景的AI技术解决方案。负责生成和感知类模型的改造和突破,解决实际业务场景中的关键技术难题。 任职资格 1、学历背景:计算机科学、自动化、电子工程、数学等相关专业,硕士及以上学历(博士优先)。 2、核心专业技能(CV + 多模态):计算机视觉: 精通CV感知类模型的方法和技术细节,对YOLO、DETR、Swin、SAM等主流模型有深入理解和实践经验,具备实际业务落地经验。 3、多模态大模型: 熟悉经典多模态模型的原理和技术细节,包括但不限于CLIP、BLIP、LLaVA等,理解视觉与语言的跨模态对齐机制。 4、工程化与编程能力:具备扎实的编程功底,熟练使用C++/Python等常用语言。熟悉Linux开发环境,熟练掌握深度学习框架(PyTorch/TensorFlow)。具备模型轻量化(量化、剪枝、蒸馏)及部署优化经验(如TensorRT/ONNX/Docker)者优先。