数据工程师
福州
本科及以上
计算机类·统计学类
使用简历深度优化功能,快速提升简历质量
职位介绍
1.负责为大模型应用构建高质量的数据集,采用合适的数据增强技术,完成数据的采集、清洗、标注与处理。
2.参与搭建和维护数据管道(Data Pipeline),确保数据处理的自动化、高效与稳定。
3.协同算法团队,为模型训练、微调和评测提供可靠的数据支持,并参与构建领域知识库。
4.探索并实践非结构化数据的处理方案,为RAG等应用提供高质量的数据基础。
学历专业:2026届或2027届本科及以上学历在读,计算机、数据科学、统计学等相关专业。
编程与SQL:熟练掌握Python进行数据处理,精通SQL,能高效地进行数据提取、转换和加载(ETL)操作。
数据处理:了解机器学习基本理论,对数据清洗、特征工程等流程有实践经验。
技术认知:了解大模型基本原理,对向量化工程、Embedding模型有基本认知者优先。
综合素质:具备强烈的责任心和解决问题的能力,注重细节,对数据质量有高标准要求。

