大模型数据研发工程师
杭州
本科及以上
计算机类·统计学类
使用简历深度优化功能,快速提升简历质量
职位介绍
【基础信息】毕业起止时间要求:2026-11-01 - 2027-10-31
【职位描述】
1.参与大模型训练数据体系的构建,协助设计高质量、大规模数据的采集、清洗、评估与迭代机制;
2.探索多模态(文本、图像、音频、视频等)数据的内容理解、质量建模与特征提取方法,支持数据驱动的大模型优化;
3.参与Prompt工程相关技术研发,包括结构化指令设计、自动化生成策略及效果验证框架的实现;
4.协助开发可扩展的数据处理工具链,结合分布式计算与AI技术,提升全模态数据生产效率与一致性;
5.与算法、工程及产品团队协作,将前沿数据方法落地到实际训练流程中,并持续跟踪效果反馈。
【职位要求】
1.计算机科学、人工智能、软件工程、数学、统计学或相关专业本科及以上学历;
2.熟练掌握 Python,具备扎实的编程能力与工程实现经验,熟悉 Linux 开发环境及常用数据处理工具;
3.了解深度学习基础,接触过多模态表征学习、大模型训练数据构建、Prompt工程或相关研究方向者优先;
4.具备数据密集型系统开发或科研项目经验(如数据清洗框架、内容理解模型、质量评估指标等);
5.具有良好的技术沟通能力与团队协作意识,对大模型数据前沿问题有浓厚兴趣,能持续深入钻研。

