返回简章2025-07-30 更新

【蚂蚁星-Plan A】算法工程师-预训练

北京·上海

本科及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述
我们负责蚂蚁集团内基础人工智能技术的研发与创新，致力于通用人工智能的实现。研究范围涵盖广泛，不仅包括语言大模型、多模态大模型等前沿的大模型技术，也深耕优化算法、知识图谱等基础AI方向。我们自主研发并开源了百灵大模型系列，旨在打造更高效、更通用的AI技术底座。我们积极推动开放协作的AI生态建设，通过技术共享、产学研合作等方式，促进人工智能技术的普惠发展，推动AI技术在各行各业的深度应用。
1. 负责研发大语言模型预训练技术，如高效的新型llm模型架构、长窗口训练技术、pretrain scaling law、高效预训练策略等。
2. 负责研发基于强化学习的推理模型，如大规模强化学习、新型RL算法、testing time scaling等。
职位要求
1. 硕士及以上学历，计算机科学或相关专业背景；
2. 熟悉语言模型预训练、模型架构设计、强化学习等技术领域；
3. 具备扎实的算法工程实现能力，熟悉Python编程语言和PyTorch深度学习框架，熟悉DeepSpeed/Megatron等主流分布式训练框架；
4. 具备良好的分析和问题解决能力、优秀的工程素养，能够独立思考和解决实际问题；
5. 具备较强的团队合作能力和沟通能力，能够与工程团队、业务团队、产品团队和其他技术团队紧密配合。

加分项：
1. 在语言大模型和机器学习领域有科研或实践经验，在国际顶级会议/期刊发表过高质量论文；
2. 在大数据处理、大规模分布式计算、分布式训练等领域有科研或实践经历。

职位来源

蚂蚁科技集团股份有限公司

民营企业 · 支付 · 成立25年

在招职位