返回简章2026-04-14 更新

大模型算法工程师（基座模型）

北京

本科及以上

计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

职位名称：大模型算法实习生/工程师【团队简介】我们是BOSS直聘大模型Nanbeige LLM基座研发团队，最新成果Nanbeige4.1-3B（https://mp.weixin.qq.com/s/2aafqNOryRvbTJvC0SjWAg）开源模型一度登顶Huggingface 趋势榜首，虽然只有3B参数，但是通过团队预训练与后训练算法创新，取得了同参数规模的sota效果，模型各方面能力超过Qwen3-32B/Qwen3-30B-A3B，未来团队在持续追求小模型领先的同时，也在招募优秀同学一起训练更强的大尺寸模型。【岗位价值】参与大模型预训练与后训练研发过程，深度参与AGI全链路。【岗位职责】：预训练： ॰ 数据优化：持续迭代数据合成与清洗流程，探索更优的数据权重分配与混入机制，多维度扩充数据来源，以数据质量与多样性驱动模型效果提升。 ॰ 结构优化：探索残差连接、记忆机制、新型优化器等架构与范式上的改进，持续提升模型效果上限；研究超稀疏MoE与线性注意力等高效架构，在保持效果竞争力的同时降低训练与推理开销，追求效果与效率的最优平衡。后训练： ॰ SFT优化：系统性筛选与设计高质量指令数据集，深入研究复杂指令与复杂环境下的合成方法，提升模型在 chat、code、agent 等多维度上的能力表现。 ॰ RL优化：深入探索 RL 算法与训练范式的创新方向，持续优化 Reward 建模与 RL 数据质量，构建以高价值数据为核心驱动的 RL 正向飞轮。【岗位要求】：扎实的计算机科学基础和编程动手能力，精通python语言。熟悉LLM/VLM的训练方式以及常见的模型结构，有Megatron-LM、Slime、VERL、OpenRLHF、Deepspeed等框架的实战经验。在预训练或后训练有过拿收益的经验，包括但不限于数据清洗、数据合成、数据权重配比、模型结构优化等手段。良好的团队合作精神，对 AI 技术发展有热情和技术信念，善于学习新事物，渴望用技术改变未来。

职位来源

北京华品博睿网络技术有限公司

民营企业 · 商业服务 · 成立12年

在招职位