logologo
寻找工作
返回简章2025-09-18 更新

大模型算法工程师-实习生

武汉
硕士及以上
计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责: 1、基于业务场景(行为识别)对InternVL、QwenVL等VLM模型进行领域适配性微调,优化图像理解、动作识别、多模态推理能力; 2、构建零售场景专属数据集,设计数据增强策略,解决遮挡、光照变化等实际场景挑战; 3、实现CV&VLM模型在边缘设备(如Jetson系列)/云端的轻量化部署,优化推理速度与资源占用; 4、开发模型服务化接口,支持实时视频流分析与行为事件触发机制; 5、设计时序行为分析框架,融合目标检测(如定位、姿态估计、动作分类等多模块协同工作; 6、构建基于VLM的异常行为识别系统(违规操作等场景); 7、跟进VLM前沿技术(如多模态prompt工程、模型蒸馏),探索3D视觉与VLM的融合方案; 8、输出可复用的算法组件库,建立零售场景算法基准测试体系; 岗位要求: 1、熟练掌握PyTorch框架及HuggingFace生态,具有InternVL/QwenVL等开源VLM实战调优经验; 2、精通模型压缩技术(量化/剪枝/知识蒸馏),有VLLM/LMdeploy等部署工具实战经验; 3、熟悉视频理解技术栈(OpenCV/FFmpeg/Decord),具备多线程视频处理系统开发能力; 4、具备强工程实现能力,主导过至少1个完整AI项目从研发到落地的全生命周期; 5、理解行为场景特性:能通过算法设计应对监控视角差异、制服相似度、复杂背景干扰等挑战; 6、有行为识别项目经验者优先,熟悉NTU RGB+D、AVA等行为数据集者加分; 7、具备产品化思维,能协同硬件团队优化计算资源分配方案; 8、具有技术文档撰写习惯,代码符合工业级可维护性标准; 9、在CVPR/ICCV/ECCV等会议发表过多模态学习相关论文; 10、有成功通过模型微调提升特定场景指标30%以上案例; 11、具备模型服务高并发处理经验; 我们提供: 参与千万级门店智能化改造的行业标杆项目; 配备A100/H200算力集群及边缘设备开发套件; 技术成果可快速应用于数万线下零售场景; 与VLM领域顶尖团队定期技术交流机会; 算法实习生,一周至少实习4天,3个月起步 计算机类相关专业,之前有过算法实习经验