logologo
寻找工作
返回简章2025-10-25 更新

强化学习-大模型算法工程师/研究员-RL方向

北京
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
研究基于Long CoT的大模型强化学习相关技术,包括算法或系统,实现技术突破,涉及: 方向一:推理能力Reasoning 方向二:智能体Agent 同时研究其他通往AGI/ASI的前沿技术 任职要求: 985/211高校研究生以上学历或优秀本科生,计算机科学、人工智能、机器学习等相关专业; 熟悉强化学习和大模型相关技术,具有相关实践和研究经验的同学为佳。 有大模型infra相关研发经验者优先。 有大模型+Agent相关研发经验者优先。 有一定的相关研究经历,发表过顶级会议论文者优先,如ICLR, NeuriPS, CoRL, ICML, CVPR等等; 具备扎实的Python编程基础,有优秀的工程能力,具有ACM等编程竞赛获奖者优先。 具备良好的团队协作能力和沟通能力;