大模型算法研究员(校园招聘)
上海
本科及以上
数学类·统计学类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责: 1.wei前沿算法研究: 紧跟大语言模型(LLM)领域的前沿动态,对预训练、指令微调、对齐技术、多模态等核心方向进行深入研究和探索。 2.模型结构与算法设计: 参与或主导新型模型结构的设计与实验,对现有训练算法进行改进与创新,持续提升模型的核心能力。 3.核心能力攻关: 针对模型在逻辑推理、代码生成、长文本处理等方面的关键挑战,进行专项技术攻关和原型验证。 4.技术影响力建设: 将研究成果转化为技术报告、专利或顶级学术论文,并参与内外部技术分享,提升团队的技术影响力。 5.评测体系构建: 参与设计和完善大模型的评测基准和方法论,科学、客观地评估模型各项能力。 任职要求: 1.计算机科学、人工智能、数学、统计学等相关专业硕士及以上学历。 2.具备扎实的深度学习和自然语言处理(NLP)理论基础,熟悉 Transformer 和 RNN 等主流模型架构。 3.精通 Python,并熟练掌握至少一种主流深度学习框架(如 PyTorch、TensorFlow)。 4.具备优秀的科研能力和创新精神,能够独立设计并实施复杂的实验。 5.在顶级会议或期刊(如 NeurIPS, ICML, ICLR, ACL, CVPR 等)上发表过论文者优先。 6.对探索 AI 技术边界充满热情,具备出色的逻辑思维和问题解决能力。 加分项 1.有大语言模型相关的项目或实习经验,熟悉预训练、微调等完整流程。 在相关领域的国际竞赛中取得优异成绩。 2.对 (RLHF 、MoE 、DPO) 有深入理解或实践。 3.有高质量的开源项目贡献。

