logologo
寻找工作
返回简章2025-12-03 更新

研究实习生(AI安全方向)

北京
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述: 针对不同算法和应用场景,建立和完善大模型安全所需的风险识别与治理体系: 1、大模型安全能力提升: 研究和开发大模型安全对齐的算法。 例如:基于人类反馈的无害内容输出控制、抵御指令攻击的防御策略,以及确保大模型对齐人类价值观。 这些算法旨在确保大模型的有益性和无害性方面进行技术平衡; 2、大模型风险评估: 通过红蓝对抗和自动化工具,建立大模型安全能力的自动化评估体系; 3、长期风险研究: 着手研究因大模型能力快速增强而产生的新型风险。 例如:大模型逐渐增强的Planning和Reasoning能力用于复杂系统中的应用、工具调用和决策能力所带来的新型风险。 任职要求:  1、硕士及以上学历,专业方向为计算机科学、人工智能或机器学习; 2、具备大模型安全研究经验者优先; 有在复杂应用场景中进行风险控制的经验者优先; 3、精通Transformers、DeepSpeed等大模型相关框架,能够对模型进行部署和微调以适应特定任务。 具有相关实际经验者优先考虑。