【Plan A】助理研究员-基础算法-AGI研究中心-27届
北京·杭州
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
部门介绍:
实验室专注下一代大模型底座的研发,构建通用SFT与强化学习的工业级后训练基建,驱动数据飞轮高效运转,并依托前沿评测体系持续牵引模型能力迭代。同时,团队正全面开拓扩散大语言模型的全流程研究,以极致的系统工程驱动通用智能演进。
职位描述:
1. 主导或参与下一代扩散大语言模型(Diffusion Large Language Model)的核心架构设计与全流程研发,推动通用智能底座的演进;
2. 攻坚大语言模型长程 Agentic 扩展、原生多模态扩展及训练稳定性问题,深入分析并解决 infra 系统与算法层面的疑难杂症;
3. 设计并实现创新的解码与推理策略,探索高效的概率采样方案以拓展模型生成策略的多样性;
4. 将前沿生成模型理论(如随机过程、最优化)与极致的系统工程相结合,指导算法创新并推动技术的高效落地;
5. 与前沿研究团队协作,在解决实际算法瓶颈的同时,提炼科学问题并发表研究型文章。
职位要求
1. 具备扎实的深度学习理论基础,对扩散模型(Diffusion Models)、大语言模型架构底层逻辑及核心数学原理有深刻理解与持续追踪;
2. 具备丰富的超大规模模型训练、训练基建(如 Megatron、AReaL、Verl、miles)的调试与系统工程优化经验;
3. 在人工智能顶级会议(如 NeurIPS、ICLR、ICML 等)有研究成果发表经验者优先;
4. 具备极佳的复杂问题拆解能力与技术直觉,对科学发现与技术突破有极高的自我内驱力,享受技术攻坚的乐趣;
5. 具备优秀的学术经验,目标导向,敢于担当,能够与团队在无人区进行前瞻性探索协作。
实验室专注下一代大模型底座的研发,构建通用SFT与强化学习的工业级后训练基建,驱动数据飞轮高效运转,并依托前沿评测体系持续牵引模型能力迭代。同时,团队正全面开拓扩散大语言模型的全流程研究,以极致的系统工程驱动通用智能演进。
职位描述:
1. 主导或参与下一代扩散大语言模型(Diffusion Large Language Model)的核心架构设计与全流程研发,推动通用智能底座的演进;
2. 攻坚大语言模型长程 Agentic 扩展、原生多模态扩展及训练稳定性问题,深入分析并解决 infra 系统与算法层面的疑难杂症;
3. 设计并实现创新的解码与推理策略,探索高效的概率采样方案以拓展模型生成策略的多样性;
4. 将前沿生成模型理论(如随机过程、最优化)与极致的系统工程相结合,指导算法创新并推动技术的高效落地;
5. 与前沿研究团队协作,在解决实际算法瓶颈的同时,提炼科学问题并发表研究型文章。
职位要求
1. 具备扎实的深度学习理论基础,对扩散模型(Diffusion Models)、大语言模型架构底层逻辑及核心数学原理有深刻理解与持续追踪;
2. 具备丰富的超大规模模型训练、训练基建(如 Megatron、AReaL、Verl、miles)的调试与系统工程优化经验;
3. 在人工智能顶级会议(如 NeurIPS、ICLR、ICML 等)有研究成果发表经验者优先;
4. 具备极佳的复杂问题拆解能力与技术直觉,对科学发现与技术突破有极高的自我内驱力,享受技术攻坚的乐趣;
5. 具备优秀的学术经验,目标导向,敢于担当,能够与团队在无人区进行前瞻性探索协作。


