logologo
寻找工作
返回简章2026-04-01 更新

生物药研发数据清洗大语言模型 MJ008924

上海
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述 1. 数据清洗与整合 · 深入理解业务需求,从多源异构数据中识别关键业务关系,完成复杂数据清洗、转换与整合。 · 设计高效的数据清洗流程,解决脏数据、缺失值、冗余字段等问题,确保数据质量符合分析要求。 2. 大语言模型处理、开发与部署支持 · 参与大语言模型的部署、调优及落地应用,解决模型推理中的性能瓶颈。 · 基于ADP/Dify/Coze/Fast GPT等平台搭建企业级知识库,实现非结构化数据的清洗、向量化存储与高效检索; · 设计并开发自动化工作流(Workflow),集成LLM能力完成复杂任务编排; · 开发智能体(Bot),优化对话逻辑与多轮交互体验; · 编写高质量Prompt模板,结合业务场景优化LLM输出效果; · 参与模型微调与评估,提升任务准确率与响应效率; · 协助完成技术文档编写、测试与部署工作。 · 探索大模型在业务场景的适配性,设计数据驱动的模型改进方案。 · 跟踪大模型领域最新技术动态(如数据增强、RLHF等),推动技术落地。 · 与算法、产品团队紧密协作,提供数据侧的技术支持与解决方案。 3. 跨团队协作 · 熟悉项目管理方法和管理工具,负责项目计划、实施、日常管理工作,对项目成本、人员、进度、质量、风险进行有效控制与管理; · 进行需求调研,理解用户痛点,将用户需求转化为具体的需求文档和规格说明书,并进行优先级排序,确保开发团队能够清晰理解并据此实施; · 牵头用户体验优化,分析产品使用数据和用户反馈,提出产品改进建议,提升用户体验; · 具有良好的沟通能力、业务理解能力、团队协作能力、高执行力、项目推动能力,善于发现和解决问题。与业务部门紧密合作,将模糊需求转化为可落地的数据解决方案。 任职要求 1. 基础要求 · 机器学习/AI/数据科学/CS/统计/商业分析等相关专业 · 硕士及以上学历优先 · 有海外学习、工作或科研经历优先 2. 硬性技能 · 数据处理与编程 1. 掌握Python基础语法与自定义函数开发 2. 熟悉JSON/YAML数据格式解析及API交互 3. 精通SQL/Python编程,熟练使用Pandas/NumPy/Spark工具链 4. 具备数据增删改查、多表关联查询、复杂数据清洗等实战经验,能够清洗并同步实时数据 · AI应用开发平台实战 1. 精通Dify/Coze等平台全流程开发,涵盖知识库构建、工作流设计、Bot开发 2. 具备通过配置化方式快速实现AI应用原型落地的能力 · Prompt工程 1. 掌握角色定义/思维链(CoT)/Few-shot等提示词设计技巧 2. 擅长输出格式优化(JSON结构化/Markdown排版等业务适配) · LLM认知体系 1. 熟悉GPT/Claude/GLM等主流模型特性及场景适配 2. 深入理解GPT/Deepseek/LLaMA等技术原理,具备模型部署调优经验 · 加分项 1. 熟悉AWS/Azure/阿里云等云平台 2. 知识图谱构建经验 3. 了解Docker/K8s容器化技术 4. RAG技术:掌握检索增强生成技术原理与实现方法 5. NLP技术深度:精通NLTK/spaCy/Transformers等技术栈,掌握词向量/序列标注/文本生成等核心技术,具有文本分类/信息抽取/对话系统等实战项目经验 6. 会使用Cursor: a) 前端开发,例如创建网站或应用程序的用户界面,运用HTML、CSS和Java script等技术实现页面布局、交互效果; b) 后端开发,运用Python、Java、C#、.Net、SQL等搭建服务器,处理业务逻辑,操作数据库; c) 进行系统测试和优化,包括检查代码错误、提升性能、优化数据库查询等工作,确保产品的稳定性和高效性。 3. 软性能力 · 学习能力与学习意愿: 主动求知:面对新领域、新技术或复杂业务场景时,能够主动识别知识缺口,通过查阅文档、搜索资料、请教同事等方式快速补齐,不等待被动指导 不懂就问:遇到卡点或不确定事项时,能够及时、清晰地向上级或协作方提问,带着思考提问而非空泛求助,确保问题高效解决 持续进化:定期复盘工作方法论,主动学习行业最佳实践,将新知识转化为可复用的工作模式,实现自我迭代 · 工作交付与质量意识: 质量优先:交付成果前主动自查,确保逻辑严谨、细节到位,不因赶进度而牺牲交付标准 工作留痕:关键决策、重要沟通、项目节点均形成书面记录(文档/邮件/协作工具),确保信息可追溯、经验可沉淀、交接无遗漏 · 项目管理与需求分析: 业务翻译能力:能将业务问题转化为数据问题,例如通过数据关系梳理反推业务逻辑。 工程化思维:拒绝“一次性脚本”,具备设计可复用、可监控的数据处理流程的意识。 进度把控能力:能够规划自己所负责的模块进度,明确任务分工,确保按时交付。 沟通能力:逻辑清晰,对数据敏感,具备优秀的跨团队沟通能力。