返回简章2026-04-16 更新

【基座模型】安全对齐工程师-北京(A123260)

北京

本科及以上

计算机类·自动化类

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述： 1. 负责智能体对齐研究及落地，包括智能体对齐训练管线及数据建设； 2. 参与VLA职业价值观对齐工作，涉及体系和benchmark，数据构建及模型优化； 3. 负责大模型RedTeam能力建设，持续构造攻防数据提升模型对齐能力。职位要求： 1. 熟悉常见大语言模型如Qwen、LLama等开源模型，有基座/垂域大模型微调和应用经验； 2. 熟悉模型后训练技术，如监督微调（SFT）、DPO、人类反馈强化学习（RLHF）； 3. 具备出色的编程与工程实现能力，精通至少一门主流开发语言（如 C/C++、Go、Python 等）； 4. 有模型安全/智能体对齐经验优先；有主流RL框架（VeRL、OpenRLHF等）开发经验者优先； 5. 良好的沟通协作能力，能够与团队紧密合作； 6. 具有分析和解决问题的能力，有自主探索解决方案的能力。

职位来源

北京罗克维尔斯科技有限公司

民营企业 · 商业服务 · 成立8年

在招职位