返回简章2026-05-20 更新

计算机视觉及多模态算法工程师（北京）

北京

本科及以上

不限专业

使用简历深度优化功能，快速提升简历质量

职位介绍

学历要求硕士及以上学历专业要求计算机、人工智能、电子工程等相关专业岗位职责 1. 负责多模态大模型的研发和应用，研究相关技术在智能助手、智能硬件等领域的全新应用和解决方案，包括而不限于多模态理解生成，视觉Agent等能力，研发以人工智能技术为核心的新技术、新产品； 2. 参与多模态大模型的结构设计、预训练任务、模型训练和推理等工作，包括但不限于多模态预训练、跨模态检索、多模态对话、RAG、UI Agent等； 3. 探索超大规模模型，进行极致系统优化, 参与数据建设、指令微调、偏好对齐、模型优化、原型系统搭建、大模型应用构建； 5. 结合电信业务和开源技术，对大模型的特定能力进行针对性优化, 在相关应用落地，包括视频解析布控系统、事件检索系统、智能助手、智能硬件等。任职要求： 1. 优秀的代码能力、数据结构和基础算法功底，熟练C/C++或Python，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先； 2. 具有优秀的基础算法、扎实的机器学习基础，熟悉CV、AIGC、NLP、RL、ML等领域的技术，在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等会议/期刊上发表论文者优先； 3. 熟悉QWenVL、LLava等多模态大模型的框架、预训练和微调等技术，有 MLLM、LLM、RAG、UI Agent方向的实际落地经验优先，熟悉大模型训练、RL算法者优先； 4、出色的问题分析和解决能力，能深入解决大模型训练和应用存在的问题； 5、良好的沟通协作能力，能和团队一起探索新技术，推进技术进步。

职位来源

中国电信集团有限公司

央企 · 电信运营服务 · 成立31年

462

在招职位