数据标注(英语六级+计算机背景)
天津
本科及以上
计算机类·外国语类
使用简历深度优化功能,快速提升简历质量
职位介绍
一、项目简介
本项目为视觉问答数据标注项目的质检环节。项目前置要求标注人员负责根据规范要求采集图片、撰写中文Prompt问题、调用大模型获取回答并判断其正确性、对错误回答进行修正。质检人员则对标注人员提交的全部数据进行质量审核,不承担标注生产工作,但需深入理解标注规范,以确保审核工作的准确性和权威性。
二、岗位职责
依据项目标注规范,审核标注人员已完成的VQA数据条目,对标注结果进行逐一或抽样质量检查;
验证图片与Prompt是否相关,确保问题必须依赖图片信息方可作答;
核查标注人员对模型回答正确性的判断是否准确,包括事实性错误、逻辑谬误、幻觉及信息缺失等;
审核标注人员对图像内容的理解是否正确,确保物体识别、属性感知、空间关系、数量统计等视觉信息解读无误;
验证模型能力调用的标注是否准确,确认问题所涉及的推理技能(计数、空间推理、数学计算、逻辑推理、图表理解等)是否至少覆盖2种以上能力;
检查Prompt问题是否意图清晰、答案唯一,且符合格式要求;
对不合格任务予以退回,并注明退回原因;
审核通过的任务予以验收归档,确认数据提交入库;
参与项目复盘,根据质检结果,对数据采集标注交付结果进行分析、总结,并协助PM与客户进行沟通反馈,推动交付质量持续优化。
三、任职要求
英语能力:大学英语六级(CET-6)或同等水平,具备英文Guideline阅读理解能力(不要求口语及写作);
专业背景:专业背景不限,计算机、人工智能或相关专业优先,需要多学科科资源合理配置;
实习时间:周一到周五,全职实习6-12个月。
思维能力:具备扎实的逻辑推理与结构化思维能力,善于主动发现问题、提出高质量问题;同时具备较强的逻辑判断力与标准把控力,对标注规则有深入理解;
熟悉视觉问答数据标注的基本原理与质量评估方法,细致耐心,能准确判断模型回答中的事实性错误与逻辑谬误;
具备良好的图像理解能力,能快速解读信息图、图表、GUI界面、地图等复杂图像内容;
了解大模型的基本能力边界与常见局限性,熟悉提示词(Prompt)工程基础,能判断Prompt设计对模型回答质量的影响;识别模型回答中的常见问题(如幻觉、拒绝回答、过度冗余等),了解LLM Judge等自动评估机制的基本原理,能合理判断机器评分的准确性,并区分模型能力不足与标注人员误判的界限。

