返回简章2025-10-25 更新

强化学习-大模型算法工程师/研究员-RL方向

北京

硕士及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

研究基于Long CoT的大模型强化学习相关技术，包括算法或系统，实现技术突破，涉及：方向一：推理能力Reasoning 方向二：智能体Agent 同时研究其他通往AGI/ASI的前沿技术任职要求： 985/211高校研究生以上学历或优秀本科生，计算机科学、人工智能、机器学习等相关专业；熟悉强化学习和大模型相关技术，具有相关实践和研究经验的同学为佳。有大模型infra相关研发经验者优先。有大模型+Agent相关研发经验者优先。有一定的相关研究经历，发表过顶级会议论文者优先，如ICLR, NeuriPS, CoRL, ICML, CVPR等等；具备扎实的Python编程基础，有优秀的工程能力，具有ACM等编程竞赛获奖者优先。具备良好的团队协作能力和沟通能力；

职位来源

北京月之暗面科技有限公司

民营企业 · 人工智能软件 · 成立3年

在招职位