logologo
寻找工作
返回简章2026-05-22 更新

【26届校招】强化学习算法工程师

北京·上海·深圳...
硕士及以上
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
招聘部门:互联网 / 电子 / 网游 【岗位职责】 1.参与端到端模型的多阶段大规模预训练及FT后训练(包含RL),参与并探索自动驾驶领域的Scaling Law。 2.负责设计、优化、迭代RL系统Reward、Objective及环境建模框架,参与自动驾驶各种场景下的Self Play式模型强化训练。 3.分析并优化自动驾驶相关的OnPolicy/OffPolicy及Synthetic数据集,构建高效的模型的闭环迭代训练评估流程。 【任职要求】 1.2026 届应届毕业生,计算机科学、人工智能、机器人等相关专业硕士及以上学历。 2.具备扎实的强化学习理论基础,熟悉常见的深度学习算法及强化学习算法。 3.有一定的编程能力,熟练掌握 Python、C++ 等编程语言。 4.具备良好的数学基础,包括线性代数、概率论、统计学等。 5.有较强的学习能力和创新精神,对自动驾驶技术有浓厚的兴趣和热情。 6.具备良好的团队合作精神和沟通能力,乐于分享,有较强的沟通能力。