大模型算法工程师-校招【北斗计划】
北京
硕士及以上
计算机类·数学类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责:
1.大模型数据体系建设:优化数据的筛选与配比策略,探索动态数据调整、多阶段训练和自动配比等方法,提升数据质量和多样性,优化大模型的训练效果。
2.合成数据探索:探索大规模合成数据方法,应用于美团本地生活服务场景,制定合成数据在预训练、强化学习等不同训练阶段的应用策略。
3.模型架构优化:探索 MoE(混合专家)、稀疏注意力、线性注意力等高效模型结构,以及模型编辑、合并、压缩、剪枝等技术,产出更契合美团生活服务场景的基座模型。
4.后训练关键能力建设:包括但不限于优化模型创意生成、多语言、推理、复杂指令遵循、工具调用等能力。
5. 前沿跟进:不断探索跟进技术新领域,推动团队技术能力的沉淀和技术氛围的建设。
岗位基本要求:
1. 熟悉大模型的原理,具备数据处理、精调、预训练、强化等方面的经验;
2. 熟悉自然语言处理常见算法与模型,具备深度学习技术在NLP领域的应用实践;
3. 具备强烈的进取心、求知欲及团队合作精神,热衷于追求技术创新;
4. 在ACL、EMNLP、NAACL、NIPS、ICLR、SIGIR等自然语言处理会议或期刊中有论文发表
岗位亮点:
1、对大模型预训练、后训练、agent全链路的深入了解
2、丰富的GPU资源及核心场景数据,鼓励前沿技术探索
3、鼓励跨方向合作,在快速发展的大模型领域建立专长,成为大模型领域的技术专家。

