返回简章2025-11-04 更新

强化学习算法实习生

上海

硕士及以上

自动化类·计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

岗位职责 1.根据业务需求训练特定场景下的AI-Bot，方法不限于强化学习、模仿学习等； 2.能够基于已有的策略数据，通过模仿学习或离线强化学习的方法进行训练模型； 3.能够将策划等提出的需求归纳成条件，并迁移到RL策略中； 4.跟进行业前沿技术发展趋势，跟踪国际最新算法发展方向和相应技术； 5.能够对所做工作进行归纳整理，并能在指导下撰写论文。岗位要求 1.具有计算机科学、人工智能、自动化、电子工程等相关领域的硕士及以上学历； 2.具备但不限于以下领域相关的研究经验：多智能体强化学习、模仿学习、离线强化学习、自博弈训练、分布式强化学习； 3.良好的编码能力，熟悉 Python 语言，熟悉 Linux 开发环境； 4.对强化学习有理论基础和实践经验，熟悉 PyTorch训练框架； 5.在计算机领域有论文发表者或在机器学习相关比赛获得高排名者优先； 6.热爱游戏行业，对竞技类游戏有热情者优先。

职位来源

上海临竞科技有限公司

暂无公司数据

在招职位