logologo
寻找工作
返回简章2026-02-07 更新

阿里巴巴数据智多星-音频方向(base杭州)

杭州
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
【岗位介绍】 在人工智能技术快速发展的背景下,智多星项目致力于构建系统化、高质量的大模型知识体系,通过整合人类文化、自然科学及社会科学的精髓成果,为大模型的技术突破提供坚实的知识基础设施支撑。因此,我们需要招募具有跨学科视野、创新思维与专业深度的多元化人才加入我们: ● 竞赛达人:有丰富的学科竞赛获奖经历; ● ai小能手:玩转各种大模型及agent产品; ● 思维学霸:具有超强的学习及逻辑推理能力; ● 论文收割机:发表过大模型或数/理/化/生/金融/医学相关的高质量论文; ● 垂域人才:精通数学、物理、化学、生物、法律、医疗、金融、影视等专业领域知识。 【具体工作内容】 1. 多元数据深度分析:从零开始规划数据集的用途和框架,制定清晰且可执行的标准。深入书籍、期刊、报纸、网站和专业数据库等多样化的知识来源,以严谨的态度筛选、分类和验证数据,确保信息准确。 2. 严格把控标注质量:根据项目需求为海量数据贴上精准的标签,建立严格的标注规则和验收机制,实时监控标注过程,发现问题并迅速解决,确保输出的高质量成果。 3. 精准构建知识库:将零散的数据编织成结构化的知识体系,打造一个全面、系统化的知识库体系。不断更新和完善知识库内容,保持前沿性并满足业务需求。 4. 高效制定标注标准:制定科学合理的标注标准和计划,明确每个阶段的目标与要求。建立高效的沟通机制,及时收集和解决标注过程中遇到的问题,推动流程的持续改进。 5. AI评测与标注前沿研究:与团队开展前沿研究,合作撰写、发表高水平论文,打造有影响力的体系化数据集评测集开源工作。优秀同学能够参与学术论文、开源数据集评测集署名,受邀参与团队主办的大模型评测论坛等高规格交流活动。 【职位要求】 1.本科及以上,27届及之后 2.具备系统性语言学知识,具有cs语音算法、实验语音学、方言学背景优先 3.使用过相关大模型及agent工具,善于创作大模型prompt,具有编程技能(sql、python、java)优先 4.对本专业各类数据集的知识体系、优缺点和评估方法有自己的判断 5.在校期间涉猎广泛、博闻强识、参加过社团活动优先 6.具有较强的学习能力和逻辑思维能力,能够快速掌握新知识和技能 7.具备良好的团队合作精神和沟通能力,能够与不同背景的人员进行有效的合作