logologo
寻找工作
返回简章2026-04-05 更新

计算机视觉及多模态算法工程师(北京)

北京
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
学历要求 硕士及以上学历 专业要求 计算机、人工智能、电子工程等相关专业 岗位职责 1. 负责多模态大模型的研发和应用,研究相关技术在智能助手、智能硬件等领域的全新应用和解决方案,包括而不限于多模态理解生成,视觉Agent等能力,研发以人工智能技术为核心的新技术、新产品; 2. 参与多模态大模型的结构设计、预训练任务、模型训练和推理等工作,包括但不限于多模态预训练、跨模态检索、多模态对话、RAG、UI Agent等; 3. 探索超大规模模型,进行极致系统优化, 参与数据建设、指令微调、偏好对齐、模型优化、原型系统搭建、大模型应用构建; 5. 结合电信业务和开源技术,对大模型的特定能力进行针对性优化, 在相关应用落地,包括视频解析布控系统、事件检索系统、智能助手、智能硬件等。 任职要求: 1. 优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 2. 具有优秀的基础算法、扎实的机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域的技术,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等会议/期刊上发表论文者优先; 3. 熟悉QWenVL、LLava等多模态大模型的框架、预训练和微调等技术,有 MLLM、LLM、RAG、UI Agent方向的实际落地经验优先, 熟悉大模型训练、RL算法者优先; 4、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题; 5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。