返回简章2025-11-04 更新

【实习】Post-Train & Agent 算法工程师

北京

硕士及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

【岗位描述】 1、研究实用的后对齐RL算法，打造稳定鲁棒的reasoning+agent的RL训练体系； 2、探索超大规模模型，并进行极致系统优化； 3、基础模型后训练端到端指标优化 4、Code Agent与通用Agent的数据建设和模型优化； 5、Agent真实应用场景的优化探索。【岗位要求】 1、国内外高校研究生在读，人工智能、计算机、自动化、数学相关专业优先； 2、扎实的机器学习基础，熟悉NLP、RL领域的技术，在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先； 3、优秀的代码能力、数据结构和基础算法功底，熟练C/C++或Python，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先； 4、在大模型领域、Agent领域或RL领域，主导过大影响力的项目或论文者优先； 5、出色的问题分析和解决能力，能深入解决大模型训练和应用存在的问题，有自主探索解决方案的能力； 6、良好的沟通协作能力，能和团队一起探索新技术，推进技术进步。

职位来源

北京阶跃星辰智能科技有限公司

民营企业 · 人工智能软件 · 成立3年

在招职位