AI Infra工程师-AI数据系统
深圳
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责:1、参与语言、多模态与 Agent 场景下数据生产与流转体系的开发,构建高吞吐、可扩展的数据基础设施,优化数据采集、处理、存储与分发效率,支撑规模化模型训练与行业调优。
2、参与面向异构分布式环境的数据处理与调度系统的开发,实现分布式数据流水线与推理服务化架构,支持多模型推理、数据合成与蒸馏的高并发执行,提升资源利用率与整体吞吐。
3、参与统一数据格式与版本管理体系的实现,参与面向大规模训练与推理的存储架构开发,提升数据可追溯性与生命周期管理能力,支撑 PB 级数据规模扩展。
4、参与大模型数据工程平台与工具链能力的建设,包括任务编排、指标采集、失败恢复与自动扩缩容等模块的实现,推动数据生产与验证的自动化闭环,支撑数据飞轮高效运转。
5、跟踪分布式计算、存储与推理加速等前沿技术,与算法及平台团队协作,推动数据工程与训练系统、推理服务及 Agent 架构的融合落地,持续提升工程成熟度与技术竞争力。
任职要求:1、计算机科学、软件工程、人工智能、计算机工程、机器学习、数据工程等相关专业,具备扎实的计算机系统基础。
2、具备较强的代码编写和算法实现能力,熟悉模型架构、数据工程、操作系统、分布式计算与存储系统、并行软件开发。
3、具备较强的学习能力、自驱意识、团队意识和责任意识,能够积极参与团队协作,快速适应技术迭代。

