【基座模型】安全对齐工程师-北京(A123260)
北京
本科及以上
计算机类·自动化类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述:
1. 负责智能体对齐研究及落地,包括智能体对齐训练管线及数据建设;
2. 参与VLA职业价值观对齐工作,涉及体系和benchmark,数据构建及模型优化;
3. 负责大模型RedTeam能力建设,持续构造攻防数据提升模型对齐能力。
职位要求:
1. 熟悉常见大语言模型如Qwen、LLama等开源模型,有基座/垂域大模型微调和应用经验;
2. 熟悉模型后训练技术,如监督微调(SFT)、DPO、人类反馈强化学习(RLHF);
3. 具备出色的编程与工程实现能力,精通至少一门主流开发语言(如 C/C++、Go、Python 等);
4. 有模型安全/智能体对齐经验优先;有主流RL框架(VeRL、OpenRLHF等)开发经验者优先;
5. 良好的沟通协作能力,能够与团队紧密合作;
6. 具有分析和解决问题的能力,有自主探索解决方案的能力。

