返回简章2025-12-03 更新

研究实习生(AI安全方向)

北京

硕士及以上

不限专业

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述：针对不同算法和应用场景，建立和完善大模型安全所需的风险识别与治理体系： 1、大模型安全能力提升：研究和开发大模型安全对齐的算法。例如：基于人类反馈的无害内容输出控制、抵御指令攻击的防御策略，以及确保大模型对齐人类价值观。这些算法旨在确保大模型的有益性和无害性方面进行技术平衡； 2、大模型风险评估：通过红蓝对抗和自动化工具，建立大模型安全能力的自动化评估体系； 3、长期风险研究：着手研究因大模型能力快速增强而产生的新型风险。例如：大模型逐渐增强的Planning和Reasoning能力用于复杂系统中的应用、工具调用和决策能力所带来的新型风险。任职要求： 1、硕士及以上学历，专业方向为计算机科学、人工智能或机器学习； 2、具备大模型安全研究经验者优先；有在复杂应用场景中进行风险控制的经验者优先； 3、精通Transformers、DeepSpeed等大模型相关框架，能够对模型进行部署和微调以适应特定任务。具有相关实际经验者优先考虑。

职位来源

北京智源人工智能研究院

民营企业

在招职位