logologo
寻找工作
返回简章2026-06-06 更新

大模型算法(27届可转正)-主板上市包三餐

上海
本科及以上
计算机类·数学类
使用简历深度优化功能,快速提升简历质量
职位介绍
【接受多种合作模式】: 1、对AI底层技术充满狂热,享受从0到1攻克技术难关的成就感; 2、拥有极强的自主学习能力,面对复杂问题能快速拆解并找到突破口; 3、具备技术Owner意识,既能独立推进项目也能协同团队攻坚; 4、相信"聪明是天赋,极致是选择",愿为技术突破付出超越常人的努力。 【核心战场】: 1、主导大模型预训练全流程优化(架构设计/分布式训练/性能调优); 2、研发创新微调方案,提升模型垂直领域表现; 3、构建自动化训练平台,实现训练效率的指数级提升; 4、探索RLHF 技术(PPO/DPO/GRPO )、模型蒸馏等前沿技术方向,保持技术前瞻性。 【必备武器库】: 1、参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、评测、推理部署等; 2、精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架; 3、熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验; 4、熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验; 5、熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法; 6、熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验; 超酷的成长路径 管理线:岗位小白 → 独当一面的模块负责人 →多模块负责人→TL 专家线:深耕专业领域 → 成为专业领域大牛 福利拉满,快乐工作 工作时间:9-18点 双休! 每年2次晋升调薪机会 + 核心员工期权奖励 导师1v1带教 + 内部技术分享 特斯拉/小米汽车等你拿(特殊贡献奖!) 吃货天堂:免费三餐 + 下午茶,食堂堪比美食街 玩得嗨:年度旅游、健身房、羽毛球馆、节日礼品、包体检