大模型评测算法实习生(通义\淘天)
北京
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
base北京~~~ 【岗位介绍】 在人工智能技术快速发展的背景下,智多星项目致力于构建系统化、高质量的大模型知识体系,通过整合人类文化、自然科学及社会科学的精髓成果,为大模型的技术突破提供坚实的知识基础设施支撑。因此,我们需要招募具有跨学科视野、创新思维与专业深度的多元化人才加入我们: ● 竞赛达人:有丰富的学科竞赛获奖经历; ● ai小能手:玩转各种大模型及agent产品; ● 思维学霸:具有超强的学习及逻辑推理能力; ● 论文收割机:发表过大模型或数/理/化/生/金融/医学相关的高质量论文; ● 垂域人才:精通数学、物理、化学、生物、法律、医疗、金融、影视等专业领域知识。 【具体工作内容】 1. 多元数据深度分析:从零开始规划数据集的用途和框架,制定清晰且可执行的标准。深入书籍、期刊、报纸、网站和专业数据库等多样化的知识来源,以严谨的态度筛选、分类和验证数据,确保信息准确。 2. 严格把控标注质量:根据项目需求为海量数据贴上精准的标签,建立严格的标注规则和验收机制,实时监控标注过程,发现问题并迅速解决,确保输出的高质量成果。 3. 精准构建知识库:将零散的数据编织成结构化的知识体系,打造一个全面、系统化的知识库体系。不断更新和完善知识库内容,保持前沿性并满足业务需求。 4. 高效制定标注标准:制定科学合理的标注标准和计划,明确每个阶段的目标与要求。建立高效的沟通机制,及时收集和解决标注过程中遇到的问题,推动流程的持续改进。 5. AI评测与标注前沿研究:与团队开展前沿研究,合作撰写、发表高水平论文,打造有影响力的体系化数据集评测集开源工作。优秀同学能够参与学术论文、开源数据集评测集署名,受邀参与团队主办的大模型评测论坛等高规格交流活动。 【职位要求】 1. 本科及以上,27届及之后 2.有大模型训练/应用/评测 or 智能体开发相关经验 3.至少熟悉Megatron、deepspeed、langchain、verl等一种基础框架 4.至少熟练使用Python、C++、Java等一种编程语言 5.有高水平论文发表或优秀开源项目优先

