CV算法工程师(J18307)
北京·廊坊
博士
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责
1、多模态算法研发与落地:以多模态大模型(LMM/VLM)为核心,负责面向实际业务构建算法流程,端到端地完成技术方案的产品化落地。负责核心多模态大模型的算法优化,解决生成质量、多样性、可控性及采样效率等问题,特别是面向图像/视频生成模型。
2、视觉感知与能力构建:负责关键模型的能力构建,优化各类视觉感知类模型(如目标检测、3D空间理解)的精度、性能及泛化能力,最终满足业务需求。融合前沿学术成果(如CLIP、BLIP、LLaVA等),构建差异化和有竞争力的创新产品。
3、技术攻关与方案设计:深入理解业务需求,结合前沿AI技术(CV、VLM、具身智能等),设计并输出面向工业场景的AI技术解决方案。负责生成和感知类模型的改造和突破,解决实际业务场景中的关键技术难题。
任职资格
1、学历背景:计算机科学、自动化、电子工程、数学等相关专业,硕士及以上学历(博士优先)。
2、核心专业技能(CV + 多模态):计算机视觉: 精通CV感知类模型的方法和技术细节,对YOLO、DETR、Swin、SAM等主流模型有深入理解和实践经验,具备实际业务落地经验。
3、多模态大模型: 熟悉经典多模态模型的原理和技术细节,包括但不限于CLIP、BLIP、LLaVA等,理解视觉与语言的跨模态对齐机制。
4、工程化与编程能力:具备扎实的编程功底,熟练使用C++/Python等常用语言。熟悉Linux开发环境,熟练掌握深度学习框架(PyTorch/TensorFlow)。具备模型轻量化(量化、剪枝、蒸馏)及部署优化经验(如TensorRT/ONNX/Docker)者优先。

