AI数据工程开发管培生(数据预处理)27届
广州
本科及以上
计算机类·统计学类
使用简历深度优化功能,快速提升简历质量
职位介绍
技能:
●网络数据爬取,
●可部署开源模型,批处理脚本与日志排查
●数据清洗与质量过滤规则设计
● 工作职责:搭建数据清洗、对齐、筛选流水线
●产出高质量训练/验证数据集
●与算法团队协作提升数据可用率与稳定性
JD:
AI数据工程开发管培生(数据预处理方向)|27年应届生优先
全职校招岗位|本科 / 硕士应届生|培养期可计入正式试用期|1–2人
关于我们
美央创新科技(AIMIRA INNOVATION)是一家专注于医疗级具身智能机器人、医疗 AI 智能体及医疗级智能精密仪器研发与制造的高科技企业,隶属于英国 Calilia 国际集团。
公司先后获评国家级高新技术企业、国家级创新型企业、国家级科技型企业、广东省专精特新企业,并获得多项高层次人才与创新领军荣誉,包括:
●杭州未来科技城海外高层次人才奖
●苏州工业园区领军人才奖
●武汉江夏区创新领军人才奖
2025 年 9 月,公司完成第三轮数亿元 Pre-A+ 轮融资,规模位居全球 AI 医疗机器人赛道前列。公司获得多家国资平台、上市公司及头部投资机构支持,背后既有国家队资本,也有产业资本与长期主义投资人共同加持。
我们聚焦“年轻化产业智能化”,持续推动人工智能、精密制造与医学工程深度融合,已形成覆盖智能光电机器人、精准成像面诊智能体、智能注射机器人等方向的产品管线。公司核心团队来自北京大学、清华大学、伦敦大学学院(UCL)、麻省理工学院(MIT)、多伦多大学、墨尔本大学等世界一流院校,研发与产业化布局覆盖伦敦、多伦多、广州、杭州、苏州、武汉等核心城市。
如果你希望加入一家真正把 AI 落到真实场景、真实系统、真实业务流程里的公司,而不是只停留在概念和 PPT 上,美央会是一个非常不一样的起点。
岗位定位
这是一个面向本科或硕士应届毕业生的 AI 数据工程应用型开发管培岗位,聚焦训练数据构建与数据流水线体系建设方向。
需要特别说明的是,这个岗位不是短期实习岗,也不是单纯观察性质的“试试看”岗位。我们是以招聘全职入职为目标来选拔和培养管培生。也就是说,这个岗位从一开始就是按照未来正式岗位人才来筛选、培养和评估的。
对于符合要求并顺利通过培养阶段的候选人,岗位将直接进入正式用人序列。
同时,管培生培养期可作为全职入职的试用期计算。这意味着,只要你的表现达到要求,你的培养过程不是“额外绕一圈”,而是直接计入正式职业起点,成长路径更清晰,时间成本更低,发展节奏也更快。
这个安排本身也代表了我们对优秀毕业生的真实态度:
不是把你当临时支持人员来用,而是把你当未来骨干来培养。
这个岗位是做什么的?
这是一个典型的 AI 数据驱动型岗位。
你不会被安排去做简单的“数据标注或清洗执行”,而是会直接参与公司真实业务场景中的数据生产与数据质量体系建设。这个岗位更强调的是:如何把分散的数据来源、清洗规则、筛选逻辑和模型辅助能力整合起来,构建一套可复用、可扩展、可持续优化的数据流水线。
你会接触到的不只是数据处理本身,而是:
●数据如何直接影响模型效果与系统稳定性
●如何利用开源模型反向提升数据筛选与质量控制能力
●如何设计数据规则,使数据从“可用”变成“高质量可训练”
●如何把数据问题拆成模块,再把模块做成真正可运行的系统
一句话说,这不是一个“整理数据”的岗位,而是一个会让你成长为能把数据变成模型生产力的人的岗位。
你将负责
1.参与公司训练数据体系的建设,搭建数据清洗、对齐与筛选的自动化流水线。
2.进行网络数据爬取与多源数据整合,构建结构化数据输入。
3.部署与使用开源模型(如检测、分类、分割等)辅助数据筛选与质量评估。
4.设计与迭代数据清洗与过滤规则,持续提升数据一致性与有效性。
5.编写批处理脚本,实现大规模数据处理与自动化执行。
6.进行日志排查与异常分析,保障数据处理流程稳定运行。
7.与算法团队协作,基于训练效果反馈优化数据结构与筛选策略,提升数据可用率与模型表现。
8.在导师带领下,逐步成长为能独立负责一条数据生产与数据质量体系的复合型人才。
培养方式与发展路径
这个岗位采用“管培生培养 + 正式岗位导向”的方式推进。
你进入岗位后,不会被简单地作为普通助理型角色使用,而是会在真实项目中接受系统培养。培养内容包括:
●数据清洗、数据建模与数据质量控制能力训练
●数据流水线设计与自动化处理能力训练
●开源模型辅助数据筛选能力训练
●与算法、产品、业务协同推进数据闭环的能力训练
●从任务执行者向数据系统模块负责人的能力升级
更重要的是,这个培养阶段并不是悬空存在的。
培养期本身就按正式岗位导向进行管理和评估,表现达标后可直接衔接正式用人安排,且培养期可计入全职试用期。
表现优秀者,后续可向以下方向发展:
●数据工程师
●AI数据系统工程师
●数据平台与数据治理方向工程师
●AI训练数据负责人
●AI应用与数据融合方向骨干
我们希望你具备
基本要求
1.本科或硕士应届毕业生,计算机、软件工程、数据科学、人工智能等相关背景优先。
2.对 AI 数据体系 有强兴趣,不满足于只做简单数据处理,希望把数据真正变成模型能力的重要基础。
3.具备网络数据爬取经验,能够获取与处理多源数据。
4.具备基础脚本能力(Python优先),能够完成批处理任务与数据处理逻辑实现。
5.理解数据清洗与质量控制的基本方法(去重、过滤、对齐等)。
6.具备基础工程意识,能够处理日志问题与流程异常。
7.学习能力强,执行力强,能在不确定中快速推进。
8.逻辑清晰,做事有条理,能把复杂数据问题拆成步骤。
9.责任心强,能够关注细节并保证数据质量稳定。
10.有明确的职业发展意愿,希望进入一家高成长科技公司,以全职发展为目标,而不是只寻找一段短期过渡经历。
我们特别欢迎这样的人
●不一定是数据竞赛选手,但真正做过数据处理或数据工程项目
●不一定背景最传统,但对数据质量、数据结构与AI训练关系有强烈兴趣
●不一定代码很复杂,但有把“数据流程变成系统流程”的意识
●不一定经验很多,但愿意在真实数据中反复调试、验证与优化
加分项
1.有数据处理、数据流水线或数据平台相关项目经验。
2.有开源模型部署经验(如检测、分割、分类模型等)。
3.熟悉 pandas、numpy 或其他数据处理工具。
4.有大规模数据处理或自动化调度经验。
5.有 AI 训练数据构建或数据筛选优化经验。
6.喜欢折腾新工具,不排斥快速试错和边做边迭代。
这不是一个适合谁的岗位?
这不是一个只想“找一份轻松实习盖章”的岗位。
也不适合只想做纯标注或简单清洗、不愿意写代码和搭建流程的人。
更不适合不关注数据质量、不愿意处理重复工程问题的人。同时,这个岗位也不适合把它当作短暂停留选项的人。
因为我们对这个岗位的定位很明确:以全职入职和长期培养为目标。
我们更看重的是:
能不能把数据真正用起来,能不能把一个数据问题推进成可复用的系统流程,能不能把自己当成未来正式岗位的人来要求。
你会得到什么
1.极强的一线 AI 数据工程训练:不是做零散任务,而是直接参与数据系统建设。
2.跨界成长机会:同时理解数据、算法、系统与业务之间的关系。
3.高密度导师带教:你会直接接触真实问题与数据优化方法,而不是被边缘化安排打杂。
4.进入前沿赛道核心公司:医疗级具身智能机器人与AI系统是未来重要技术方向。
5.真实成果感:你构建的数据能力会直接影响模型效果与系统表现。
6.更清晰的正式入职路径:培养期可计入试用期,成长路径明确。
7.转正与长期发展空间:表现优秀者可进入数据工程与AI系统方向长期发展。
你可能会喜欢这里的原因
●你不是在做重复数据处理,而是在构建数据系统
●你不是辅助角色,而是模型能力的重要基础环节
●你参与的是真实AI系统的数据闭环
●你接触的是从数据到模型再到业务的完整链路
●你不是做一段“短期经历”,而是在进入长期成长路径
●你的成长速度,会明显快于只做单点数据工作的岗位
岗位关键词
数据工程 / 数据清洗 / 数据流水线 / 爬虫 / 批处理 / 开源模型部署 / 数据质量 / AI训练数据 / 开发管培生
投递加分建议
投递时欢迎附上以下任一材料,会明显加分:
●数据处理或数据工程项目
●爬虫或自动化脚本
●数据清洗或筛选逻辑说明
●GitHub / Demo / 项目截图
●任何能证明你“不是只处理数据,而是能构建数据系统”的材料

