logologo
寻找工作
返回简章2026-03-09 更新

26春-AI大模型算法工程师-OCR/多模态(北京)-4915(J12104)

北京
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责
1、负责PDF/DOC文档OCR相关算法/多模态解析的研发和工程实现,并将算法应用到业务场景中;
2、跟进OCR/多模态前沿技术,包括但不限于图像文字检测、识别,多语种识别,视频文本识别,版面分析,文本属性,语义理解等相关工作,进行技术难点攻关与前瞻研究;
3、通过持续优化人工智能识别算法和机器学习模型,提升光学识别的准确度和效率,提升应用的客户感知;
4、熟悉opencv。熟悉目标检测、跟踪、识别、分割、特征点等常见的任务。熟悉常见图像操作。
5、有PDF/DOC文档识别或者多模态文档经验优先;比如有OCR或者多模态解析经验,解决过财报,报表数字识别,和表格数字识别问题经验优先。
任职资格
1、对OCR技术、多模态解析/多模态文档视频内容理解方向有浓厚兴趣,有相关研发经验;
2、对深度学习基础理论和大规模实践有较深理解。
3. 精通至少一种技术语言,包括但不限于java、C/C++、C#、python等