返回简章2026-01-26 更新

大模型安全开发

杭州

本科及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

核心职责 1. 全生命周期安全：覆盖预训练、微调、RLHF、部署、智能体编排各阶段风险识别与缓解。 2. 提示词注入防御：设计通用检测与过滤框架，将SQL/Code/RAG/Tool-use等多场景攻击成功率降至0.1%以下。 3. 安全对齐微调：构建对抗性数据集。 4. 安全智能体研发：打造可自主发现、定位、修复模型缺陷的自治系统，建立多Agent安全博弈仿真平台。 5. 红队自动化：跟踪间接注入、数据投毒、模型窃取、前缀泄露、多模态幻觉等前沿攻击面，每季度输出PoC与缓解策略。必备技能 1. 教育背景：人工智能、计算机、信息安全等相关专业。 2. 微调与对齐：熟练使用LoRA、AdaLoRA、QLoRA、PPO、DPO等技术，独立完成7B+参数模型微调与RLHF。 3. 攻防实战：深入理解提示词注入、越狱、后门触发、梯度泄露、训练数据投毒等攻击原理，有真实漏洞挖掘或防御落地案例。 4. 工程能力：精通Python、PyTorch，掌握Deepspeed、Megatron、FSDP等分布式训练与量化推理。熟悉java、go或其它编程语言加分项 1. 在ChatGPT、Claude、文心、通义、Llama等主流模型上提交过高危漏洞，或获得CVE/CNVD编号。 2. 熟悉智能体开发（AutoGPT、LangChain、Transformers Agents、BabyAGI），具备Tool-calling、长期记忆、反思机制实现经验。 3. 掌握形式化验证、差分隐私、联邦学习、可信执行环境（TEE）、密码学防护等前沿技术。

职位来源

杭州安恒信息技术股份有限公司

A股上市 · 民营企业 · 通用软件

在招职位