logologo
寻找工作
返回简章2026-05-19 更新

北京机器学习算法工程师

北京
硕士及以上
计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责 1、 为行走和操作任务开发、训练和部署强化学习算法。 2、 搭建大规模支持通用人形机器人训练行走和操作策略的仿真基础设施。 3、 与控制团队合作,将训练得到的策略集成到现有的控制系统中。 4、 定义、测试和评估学习策略的性能指标。 5、 训练多任务深度神经网络。 6、 设计并交付高质量、可靠的软件,并部署到实际应用中。 7、 与其他团队成员合作,开发并持续改进完整的自主控制系统。 8、 实现机器人行为架构,提供各种行为编排工具,如状态机和行为树。 评估潜在的行为协调解决方案,并根据机器人需求做出设计权衡和决策。 9、 基于该架构,为人形机器人设计、实现、测试和部署行为协调算法,适配多种任务场景,并不断迭代提升算法的可靠性和鲁棒性。 10、 采用现代软件工程技术,编写高质量、经过充分测试的软件。 任职要求 1、 硕士及以上学历,计算机相关专业优先。 2、 在生产级软件和机器学习工程及实践方面拥有丰富经验。 3、 对深度学习有“白盒”理解:包括模型细节、损失函数设计和训练算法。 4、 在概率论、优化和线性代数方面具备扎实的数学基础。 5、 具有以下领域专业知识优先:3D重建、深度估计、神经渲染、目标检测、跟踪与状态估计、实例分割与语义分割。 6、 拥有使用主流深度学习框架(如 PyTorch)的丰富经验。 7、 在节奏快、解决方案尚不清晰且需要探索的环境中表现出色。 8、 熟悉在线和离线强化学习算法,如 PPO、SAC 等,有调优强化学习算法的超参数和代价函数的经验优先。 9、 熟悉常见的强化学习技术,如域随机化、课程学习、奖励设计等。 10、 熟悉常用的机器学习评估工具,如 TensorBoard、Weights & Biases 等。 11、 具备在真实机器人上使用 C++ 和/或 Python 实现、测试和部署行为协调解决方案的经验。 12、 在理论上对行为协调算法有深刻理解,同时拥有实际应用经验者优先。