大语言模型算法研究员
北京
硕士及以上
中文学类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
参与大语言模型的核心技术研发,包括但不限于:
- 预训练优化(数据合成、长上下文建模、训练动态分析)
- 后训练技术(强化学习、奖励模型、推理能力提升)
- 代码生成与理解(自动化数据构建、运行反馈优化)
- 模型架构创新(MoE、高效推理、稳定性优化)
- 探索AI Agent、长序列推理、在线学习等新兴方向
职位要求
熟悉大语言模型(如Transformer、MoE)的核心原理,具备以下至少一项经验:
- 大规模模型训练(分布式训练、数据优化)
- 强化学习、奖励建模或AI Agent开发
- 代码生成、程序理解或相关领域
- 模型架构优化(如高效推理、长上下文处理)
熟练使用PyTorch、DeepSpeed等框架,具备代码实现与调试能力。

