数据清洗实习生-上海-研发-26届 (MJ007295)
上海
本科及以上
生物科学类·食品工程类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作地点:上海 岗位要求:2026届本科/硕士毕业生,生物、药学、化学、医学、食品或其他与岗位相符的专业优先,认同公司文化并对生物制药行业充满热情 实习内容和基本要求: 【阶段1】 【实习时间】:3-6个月 【实习待遇】:实习薪资+住宿/班车/补贴+工作餐/补贴 【基本要求】:不低于3个月的实习期,每个月出勤率不低于90% 【实习内容】:
1、 数据清洗与整合 • 深入理解业务需求,从多源异构数据中识别关键业务关系,完成复杂数据清洗、转换与整合。
• 设计高效的数据清洗流程,解决脏数据、缺失值、冗余字段等问题,确保数据质量符合分析要求。
2、 大语言模型处理、开发与部署支持 • 参与大语言模型的部署、调优及落地应用,解决模型推理中的性能瓶颈。
• 基于Dify/Coze/煎蛋/Fast GPT等平台搭建企业级知识库,实现非结构化数据的清洗、向量化存储与高效检索;
• 设计并开发自动化工作流(Workflow),集成LLM能力完成复杂任务编排;
• 开发智能体(Bot),优化对话逻辑与多轮交互体验;
• 编写高质量Prompt模板,结合业务场景优化LLM输出效果;
• 参与模型微调与评估,提升任务准确率与响应效率;
• 协助完成技术文档编写、测试与部署工作。
• 探索大模型在业务场景的适配性,设计数据驱动的模型改进方案。
• 跟踪大模型领域最新技术动态(如数据增强、RLHF等),推动技术落地。
• 与算法、产品团队紧密协作,提供数据侧的技术支持与解决方案。
3、 跨团队协作 与业务部门紧密合作,将模糊需求转化为可落地的数据解决方案。
任职要求
1、 基础要求 • 硕士及以上学历,机器学习/AI/数据科学/CS /统计等相关专业 • 实习时间至少半年以上,实习时间长且稳定的优先 • 有海外学习、工作或科研经历优先
2、 硬性技能 • 数据处理与编程
1、 掌握Python基础语法与自定义函数开发
2、 熟悉JSON/YAML数据格式解析及API交互
3、 精通SQL/Python编程,熟练使用Pandas/NumPy/Spark工具链
4、 具备数据增删改查、多表关联查询、复杂数据清洗等实战经验,能够清洗并同步实时数据 • AI应用开发平台实战
1、 精通Dify/Coze等平台全流程开发,涵盖知识库构建、工作流设计、Bot开发
2、 具备通过配置化方式快速实现AI应用原型落地的能力 • Prompt工程
1、 掌握角色定义/思维链(CoT)/Few-shot等提示词设计技巧
2、 擅长输出格式优化(JSON结构化/Markdown排版等业务适配) • LLM认知体系
1、 熟悉GPT/Claude/GLM等主流模型特性及场景适配
2、 深入理解GPT/Deepseek/LLaMA等技术原理,具备模型部署调优经验 • 加分项
1、 熟悉AWS/Azure/阿里云等云平台
2、 知识图谱构建经验
3、 了解Docker/K8s容器化技术
4、 RAG技术:掌握检索增强生成技术原理与实现方法
5、 NLP技术深度:精通NLTK/spaCy/Transformers等技术栈,掌握词向量/序列标注/文本生成等核心技术,具有文本分类/信息抽取/对话系统等实战项目经验
3、 软性能力 • 业务翻译能力:能将业务问题转化为数据问题,例如通过数据关系梳理反推业务逻辑。
• 工程化思维:拒绝“一次性脚本”,具备设计可复用、可监控的数据处理流程的意识。
• 进度把控能力:能够规划自己所负责的模块进度,明确任务分工,确保按时交付。
• 沟通能力:逻辑清晰,对数据敏感,具备优秀的跨团队沟通能力。
【实习考核】: 考核人:带教老师/部门主管 考核规则及标准:由相关负责人制定,以培训效果检测为主 【考核结果应用】: 考核合格实习生: 可进入下一阶段实习,获得优先录用的机会 正式入职后,合同薪资为校招Offer薪资的102-104% 【阶段2】 【实习时间】:阶段1考核通过后 【实习待遇】:实习薪资高于阶段1+住宿/班车/补贴+工作餐/补贴 【基本要求】:每个月出勤率不低于90% 【实习内容】:在岗工作 【实习考核】: 考核人:带教老师/部门主管 考核规则及标准:入职后由相关负责人制定,以工作表现为主 【考核结果应用】: 考核合格实习生: 正式入职后,薪资为校园招聘Offer 102%-104% 可根据考核表现获得试用期免除的机会

