【实习】Post-Train & Agent 算法工程师
北京
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
【岗位描述】 1、研究实用的后对齐RL算法,打造稳定鲁棒的reasoning+agent的RL训练体系; 2、探索超大规模模型,并进行极致系统优化; 3、基础模型后训练端到端指标优化 4、Code Agent与通用Agent的数据建设和模型优化; 5、Agent真实应用场景的优化探索。 【岗位要求】 1、国内外高校研究生在读,人工智能、计算机、自动化、数学相关专业优先; 2、扎实的机器学习基础,熟悉NLP、RL领域的技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先; 3、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 4、在大模型领域、Agent领域或RL领域,主导过大影响力的项目或论文者优先; 5、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力; 6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。

