logologo
寻找工作
返回简章2026-02-11 更新

数据管线工程师

长沙
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责: 1、基于原始数据,构建高效、稳定的数据清洗、标注增强和特征工程流水线,为模型训练提供高质量的数据支持; 2、基于传统图像/视频/音频算法及多模态大模型,参与音视频、图像的质量评估模型研发,优化模型效果; 3、针对大批量音视频、图像数据,研发自动化标注算法,快速完成数据标注; 4、按照算法要求设计数据清洗方案,对原始数据进行处理, 任职要求(图像,音频,视频满足其一即可): 1、具备传统算法与多模态大模型相关经验:如参与过图像 / 视频 / 音频的质量评估模型研发,比如用传统算法或多模态大模型做过数据质量分析、优劣判断相关项目。 2、能根据模型的需求,搭建推理环境(比如用 Python 搭建运行模型的环境),批量处理大量音视频、图像数据,并完成精准标注(如标注图像质量等级、失真类型等)。 3、能根据算法同事给出的要求,搭建数据处理步骤(比如去重、去除模糊 / 噪声数据、格式转换等),把原始数据整理成模型能用的 “干净数据”。 4、熟练使用如 FFmpeg(处理音视频格式转换、剪辑、提取特征)、OpenCV(处理图像,如裁剪、降噪、特征提取)等工具,能独立完成基础的音视频、图像处理任务。 5、熟练掌握 Python 编程语言,了解 PyTorch/TensorFlow 等深度学习框架。 6、有较强的数据敏感度,注重数据质量,具备良好的沟通能力和团队合作精神。