AIGC 大模型研发工程师(26届)
上海
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责
1. 负责面向业务场景的大模型微调(如 SFT、LoRA、RLHF 等)与效果优化;
2. 设计并开发基于大模型的 AI Agent 系统,包括任务规划、工具调用、记忆机制等核心模块;
3. 构建和优化 RAG(检索增强生成)系统,涵盖知识库构建、向量检索、上下文融合与生成优化;
4. 可根据个人专长,在 大模型微调、Agent 架构、RAG 系统、多模态应用 等方向深入专精,或作为全栈型AI工程师覆盖多个技术环节;
5. 参与或主导端到端 AI 项目的规划、技术选型、系统设计与落地交付;
核心技术能力
1. 具备 模型训练的实际经验,或在 深度学习/机器学习 领域有扎实的项目积累;
2. 熟练掌握 PyTorch(优先)或 TensorFlow,能独立完成模型开发、训练与调试;
3. 在 NLP、CV 或多模态 至少一个方向有深入实践,熟悉相关任务(如文本生成、图像理解、跨模态对齐等);
4. 有 AI Agent 或 RAG 系统的开发经验,熟悉主流框架(如 LangChain、LlamaIndex、DSPy 等)者优先;
5. 熟悉当前主流大模型(如 LLaMA 系列、Qwen、ChatGLM、Claude、GPT 等)的特性、能力边界与适用场景,并有实际调用或集成经验;
6. 有参与或主导过完整的AI相关项目,能从需求分析推进到系统上线。
加分项
1. 有 大模型微调实战经验,包括但不限于:LoRA、QLoRA、SFT、RLHF、DPO 等技术;
2. 深入理解大模型架构(如 Transformer、MoE、位置编码机制、注意力优化等);
3. 亲手从零或继续预训练阶段训练过小型 LLM(如 1B~7B 规模);
4. 熟悉 大模型推理优化技术,如模型量化(GGUF/AWQ)、推理加速(vLLM、TensorRT-LLM)、分布式部署等;
5. 在 GitHub、技术社区有高质量开源项目、技术博客或论文发表。

