大模型算法及系统平台工程师
上海
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责: 1、专注于大模型架构设计、算法优化和训练调优,负责提升模型性能(精度、收敛速度、泛化等能力)。 2、掌握开源模型基于昇腾的训练技术、分多个阶段逐步优化昇腾训练效率,包括MOE、强化学习等。持续对系统的技术架构、算法进行改进和优化,构筑有竞争力的方案和技术; 3、专注训练/推理过程与框架优化,构建高性能计算系统,确保算法在硬件上的极致效能释放。 4、软硬件协同训练推理系统架构设计、协同优化、超大规模分布式系统设计及超线性优化;基础大模型并行策略及性能优化;模型结构优化(含蒸馏量化压缩剪枝及MoE架构)以及神经网络原理的数学建模;大模型高效解码推理和调度策略等; 5、理解主流开源模型的关键技术,包括MTP、MLP,MOE、Dual Parallel等关键技术,将优化的单点技术与源码能够理解透彻,用于模型的优化,实现关键技术突破,为相关产品提供竞争力。 6、紧密跟踪学术及工业界前沿大模型的技术发展,基于前沿技术成果进行持续创新,引领大模型的发展方向。

