大模型算法(27届可转正)-主板上市包三餐
上海
本科及以上
计算机类·数学类
使用简历深度优化功能,快速提升简历质量
职位介绍
【接受多种合作模式】:
1、对AI底层技术充满狂热,享受从0到1攻克技术难关的成就感;
2、拥有极强的自主学习能力,面对复杂问题能快速拆解并找到突破口;
3、具备技术Owner意识,既能独立推进项目也能协同团队攻坚;
4、相信"聪明是天赋,极致是选择",愿为技术突破付出超越常人的努力。
【核心战场】:
1、主导大模型预训练全流程优化(架构设计/分布式训练/性能调优);
2、研发创新微调方案,提升模型垂直领域表现;
3、构建自动化训练平台,实现训练效率的指数级提升;
4、探索RLHF 技术(PPO/DPO/GRPO )、模型蒸馏等前沿技术方向,保持技术前瞻性。
【必备武器库】:
1、参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、评测、推理部署等;
2、精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;
3、熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验;
4、熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验;
5、熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;
6、熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验;
超酷的成长路径
管理线:岗位小白 → 独当一面的模块负责人 →多模块负责人→TL
专家线:深耕专业领域 → 成为专业领域大牛
福利拉满,快乐工作
工作时间:9-18点 双休!
每年2次晋升调薪机会 + 核心员工期权奖励
导师1v1带教 + 内部技术分享
特斯拉/小米汽车等你拿(特殊贡献奖!)
吃货天堂:免费三餐 + 下午茶,食堂堪比美食街
玩得嗨:年度旅游、健身房、羽毛球馆、节日礼品、包体检

