logologo
寻找工作
返回简章2026-04-14 更新

大模型算法工程师(基座模型)

北京
本科及以上
计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位名称:大模型算法实习生/工程师 【团队简介】我们是BOSS直聘大模型Nanbeige LLM基座研发团队,最新成果Nanbeige4.1-3B(https://mp.weixin.qq.com/s/2aafqNOryRvbTJvC0SjWAg)开源模型一度登顶Huggingface 趋势榜首,虽然只有3B参数,但是通过团队预训练与后训练算法创新,取得了同参数规模的sota效果,模型各方面能力超过Qwen3-32B/Qwen3-30B-A3B,未来团队在持续追求小模型领先的同时,也在招募优秀同学一起训练更强的大尺寸模型。 【岗位价值】参与大模型预训练与后训练研发过程,深度参与AGI全链路。 【岗位职责】: 预训练: ॰ 数据优化:持续迭代数据合成与清洗流程,探索更优的数据权重分配与混入机制,多维度扩充数据来源,以数据质量与多样性驱动模型效果提升。 ॰ 结构优化:探索残差连接、记忆机制、新型优化器等架构与范式上的改进,持续提升模型效果上限;研究超稀疏MoE与线性注意力等高效架构,在保持效果竞争力的同时降低训练与推理开销,追求效果与效率的最优平衡。 后训练: ॰ SFT优化:系统性筛选与设计高质量指令数据集,深入研究复杂指令与复杂环境下的合成方法,提升模型在 chat、code、agent 等多维度上的能力表现。 ॰ RL优化:深入探索 RL 算法与训练范式的创新方向,持续优化 Reward 建模与 RL 数据质量,构建以高价值数据为核心驱动的 RL 正向飞轮。 【岗位要求】: 扎实的计算机科学基础和编程动手能力,精通python语言。 熟悉LLM/VLM的训练方式以及常见的模型结构,有Megatron-LM、Slime、VERL、OpenRLHF、Deepspeed等框架的实战经验。 在预训练或后训练有过拿收益的经验,包括但不限于数据清洗、数据合成、数据权重配比、模型结构优化等手段。 良好的团队合作精神,对 AI 技术发展有热情和技术信念,善于学习新事物,渴望用技术改变未来。