大模型安全开发
杭州
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
核心职责 1. 全生命周期安全:覆盖预训练、微调、RLHF、部署、智能体编排各阶段风险识别与缓解。 2. 提示词注入防御:设计通用检测与过滤框架,将SQL/Code/RAG/Tool-use等多场景攻击成功率降至0.1%以下。 3. 安全对齐微调:构建对抗性数据集。 4. 安全智能体研发:打造可自主发现、定位、修复模型缺陷的自治系统,建立多Agent安全博弈仿真平台。 5. 红队自动化:跟踪间接注入、数据投毒、模型窃取、前缀泄露、多模态幻觉等前沿攻击面,每季度输出PoC与缓解策略。 必备技能 1. 教育背景:人工智能、计算机、信息安全等相关专业。 2. 微调与对齐:熟练使用LoRA、AdaLoRA、QLoRA、PPO、DPO等技术,独立完成7B+参数模型微调与RLHF。 3. 攻防实战:深入理解提示词注入、越狱、后门触发、梯度泄露、训练数据投毒等攻击原理,有真实漏洞挖掘或防御落地案例。 4. 工程能力:精通Python、PyTorch,掌握Deepspeed、Megatron、FSDP等分布式训练与量化推理。 熟悉java、go或其它编程语言 加分项 1. 在ChatGPT、Claude、文心、通义、Llama等主流模型上提交过高危漏洞,或获得CVE/CNVD编号。 2. 熟悉智能体开发(AutoGPT、LangChain、Transformers Agents、BabyAGI),具备Tool-calling、长期记忆、反思机制实现经验。 3. 掌握形式化验证、差分隐私、联邦学习、可信执行环境(TEE)、密码学防护等前沿技术。

