生物药研发数据清洗大语言模型 MJ008924
上海
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
1. 数据清洗与整合
· 深入理解业务需求,从多源异构数据中识别关键业务关系,完成复杂数据清洗、转换与整合。
· 设计高效的数据清洗流程,解决脏数据、缺失值、冗余字段等问题,确保数据质量符合分析要求。
2. 大语言模型处理、开发与部署支持
· 参与大语言模型的部署、调优及落地应用,解决模型推理中的性能瓶颈。
· 基于ADP/Dify/Coze/Fast GPT等平台搭建企业级知识库,实现非结构化数据的清洗、向量化存储与高效检索;
· 设计并开发自动化工作流(Workflow),集成LLM能力完成复杂任务编排;
· 开发智能体(Bot),优化对话逻辑与多轮交互体验;
· 编写高质量Prompt模板,结合业务场景优化LLM输出效果;
· 参与模型微调与评估,提升任务准确率与响应效率;
· 协助完成技术文档编写、测试与部署工作。
· 探索大模型在业务场景的适配性,设计数据驱动的模型改进方案。
· 跟踪大模型领域最新技术动态(如数据增强、RLHF等),推动技术落地。
· 与算法、产品团队紧密协作,提供数据侧的技术支持与解决方案。
3. 跨团队协作
· 熟悉项目管理方法和管理工具,负责项目计划、实施、日常管理工作,对项目成本、人员、进度、质量、风险进行有效控制与管理;
· 进行需求调研,理解用户痛点,将用户需求转化为具体的需求文档和规格说明书,并进行优先级排序,确保开发团队能够清晰理解并据此实施;
· 牵头用户体验优化,分析产品使用数据和用户反馈,提出产品改进建议,提升用户体验;
· 具有良好的沟通能力、业务理解能力、团队协作能力、高执行力、项目推动能力,善于发现和解决问题。与业务部门紧密合作,将模糊需求转化为可落地的数据解决方案。
任职要求
1. 基础要求
· 机器学习/AI/数据科学/CS/统计/商业分析等相关专业
· 硕士及以上学历优先
· 有海外学习、工作或科研经历优先
2. 硬性技能
· 数据处理与编程
1. 掌握Python基础语法与自定义函数开发
2. 熟悉JSON/YAML数据格式解析及API交互
3. 精通SQL/Python编程,熟练使用Pandas/NumPy/Spark工具链
4. 具备数据增删改查、多表关联查询、复杂数据清洗等实战经验,能够清洗并同步实时数据
· AI应用开发平台实战
1. 精通Dify/Coze等平台全流程开发,涵盖知识库构建、工作流设计、Bot开发
2. 具备通过配置化方式快速实现AI应用原型落地的能力
· Prompt工程
1. 掌握角色定义/思维链(CoT)/Few-shot等提示词设计技巧
2. 擅长输出格式优化(JSON结构化/Markdown排版等业务适配)
· LLM认知体系
1. 熟悉GPT/Claude/GLM等主流模型特性及场景适配
2. 深入理解GPT/Deepseek/LLaMA等技术原理,具备模型部署调优经验
· 加分项
1. 熟悉AWS/Azure/阿里云等云平台
2. 知识图谱构建经验
3. 了解Docker/K8s容器化技术
4. RAG技术:掌握检索增强生成技术原理与实现方法
5. NLP技术深度:精通NLTK/spaCy/Transformers等技术栈,掌握词向量/序列标注/文本生成等核心技术,具有文本分类/信息抽取/对话系统等实战项目经验
6. 会使用Cursor:
a) 前端开发,例如创建网站或应用程序的用户界面,运用HTML、CSS和Java script等技术实现页面布局、交互效果;
b) 后端开发,运用Python、Java、C#、.Net、SQL等搭建服务器,处理业务逻辑,操作数据库;
c) 进行系统测试和优化,包括检查代码错误、提升性能、优化数据库查询等工作,确保产品的稳定性和高效性。
3. 软性能力
· 学习能力与学习意愿:
主动求知:面对新领域、新技术或复杂业务场景时,能够主动识别知识缺口,通过查阅文档、搜索资料、请教同事等方式快速补齐,不等待被动指导
不懂就问:遇到卡点或不确定事项时,能够及时、清晰地向上级或协作方提问,带着思考提问而非空泛求助,确保问题高效解决
持续进化:定期复盘工作方法论,主动学习行业最佳实践,将新知识转化为可复用的工作模式,实现自我迭代
· 工作交付与质量意识:
质量优先:交付成果前主动自查,确保逻辑严谨、细节到位,不因赶进度而牺牲交付标准
工作留痕:关键决策、重要沟通、项目节点均形成书面记录(文档/邮件/协作工具),确保信息可追溯、经验可沉淀、交接无遗漏
· 项目管理与需求分析:
业务翻译能力:能将业务问题转化为数据问题,例如通过数据关系梳理反推业务逻辑。
工程化思维:拒绝“一次性脚本”,具备设计可复用、可监控的数据处理流程的意识。
进度把控能力:能够规划自己所负责的模块进度,明确任务分工,确保按时交付。
沟通能力:逻辑清晰,对数据敏感,具备优秀的跨团队沟通能力。

