大语言模型研究实习生(J11103)
深圳
硕士及以上
中文学类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责: 1.研究及开发针对大模型继续预训练和指令微调的合成数据技术和平台; 2.研究面向复杂推理场景的大语言模型多智能体系统; 3.进行实验并撰写相关论文,以及协助团队推进算法和模型在业务场景的落地; 任职资格: 1.计算机、软件等相关专业研究生; 2.具备NLP及大语言模型的相关基础理论知识,有相关实战项目经验或论文发表; 3.熟悉python语言和常见的深度学习、自然语言处理框架,比如pytorch,huggingface等; 4.对合成数据、图增强大模型推理技术、多智能体、小语种模型等领域中至少一项有深入研究的候选人优先; 5.在ACL, EMNLP, NAACL, ICLR, NeurIPS, ICML, KDD, WWW, AAAI等AI领域顶级会议上发表过论文的候选人优先; 6.有大语言模型训练分布式经验,熟悉一种大模型分布式训练或推理工具(Deepspeed,Megatron,LLaMA-Factory,vLLM等)的候选人优先; 7.可以在深圳本地实习半年以上的同学优先。

