视频理解大模型业务研发
北京
本科及以上
电子信息类·自动化类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责:
- 负责多模态大模型、视频理解大模型的研发与业务落地
- 非研究岗位,组内有时会有论文机会,但不确定,以发论文为目标的同学请提前沟通。
任职要求:
- 较强的代码能力:能独立快速开发中小型项目(1000行左右Python),能够根据需求修改中大型开源框架(例如vllm、transformers)等,能在程序出错时系统性排查问题。不排斥用AI编程,但希望你可以驾驭AI编程。
- 深度学习基础扎实,熟练使用PyTorch
- 熟悉主流开源多模态大模型,例如Qwen-VL/Omni等,了解其模型结构、训练方法等
- 熟练应用大模型:具体技能包括但不限于熟练应用Prompt Engineering,部署推理,面向垂类任务微调,要求有相关经验,使用过对应的框架,或成规模处理过训练数据
- 参与过视频相关的项目的优先,使用过一些基础的视频处理工具,例如ffmpeg
- 能够实习3个月以上,最好6个月,要求线下实习(地点北京),导师同意,能保证出勤时间
其他:
- 沟通请根据个人实习目标和任职要求进行自我介绍,海投不回
- 面试会考察实际业务代码,请准备一个生产环境(例如平时科研使用的环境,最好有GPU,可以跑pytorch、一些简单的模型)

