大模型算法工程师-可培养-可转方向
上海
硕士及以上
计算机类·统计学类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责 在本岗位,您将有机会同时深入技术本质并驱动业务落地,具体将参与:
1、大模型基座研发与优化:参与构建及优化面向电商领域的多语言、多模态(图/视频/语音等)大模型基座,全流程深入数据处理、样本标注、模型预训练(Pretrain)、有监督微调(SFT)以及强化学习(RL)对齐等关键环节。
2、前沿技术探索与创新:持续跟踪并攻关大模型领域的前沿方向(如:Test-time scaling、Long Context、更高效的训练/推理框架等),通过算法创新持续提升模型的准确性、泛化性与性能。
3、大模型应用落地与赋能:将先进的模型能力与电商业务场景结合,主导技术方案的设计与实现,具体应用方向包括但不限于: ◦ 体验革新:AI交互式搜索、生成式推荐、智能导购、智能运营助手、智能客服机器人等 ◦ 内容创造:高质量多语言、多模态(文字、图片、视频等)的商品信息生成、数字人互动等 ◦ 效率提升:漏斗效率优化、实时翻译、智能代码助手等
4、技术价值闭环:深度理解业务场景,利用平台丰富的数据资源,推动技术创新落地,并通过AB实验等科学方法验证技术价值,最终提升用户、商家体验和商业效益。
任职要求 我们期望您具备:
1、教育背景:
2024、9-
2026、8期间已获得或即将获得博士/硕士学位的同学,计算机科学、人工智能、数学、物理等相关专业优先。
2、技术根基: ◦ 具备扎实的机器学习基础、出色的数据敏感度和优秀的编程能力。
◦ 深入理解主流大模型(如GPT、Qwen、LLaMA、GLM系列)、多模态模型(如Qwen-VL、InternVL)的技术原理。
◦ 熟悉大模型训练全流程(Pretrain/SFT/RLHF)或生成式模型(如Diffusion、Flux、GAN、VAE)者优先。
3、创新能力:具备极强的学习能力、主动性和创新思维,能够独立分析和解决复杂技术问题,对将前沿研究应用于实际挑战充满热情。
4、成果导向:在学术或工业项目中有突出表现者优先,例如但不限于: ◦ 在CCF-A类会议/期刊(如NeurIPS, ICML, CVPR, ACL等)发表过论文。
◦ 在ACM编程竞赛、Kaggle等知名算法竞赛中获奖。
◦ 主导或深度参与过有较大技术影响力的大模型相关项目。

