课程大纲

机器人学习导论

  • 机器人中的机器学习概述
  • 监督学习、无监督学习与强化学习的对比
  • 强化学习在控制、导航和操作中的应用

强化学习基础

  • 马尔可夫决策过程(MDP)
  • 策略、价值和奖励函数
  • 探索与利用的权衡

经典强化学习算法

  • Q-learning与SARSA
  • 蒙特卡洛与时间差分方法
  • 值迭代与策略迭代

深度强化学习技术

  • 将深度学习与强化学习结合(深度Q网络)
  • 策略梯度方法
  • 高级算法:A3C、DDPG和PPO

机器人学习仿真环境

  • 使用OpenAI Gym和ROS 2进行仿真
  • 为机器人任务构建自定义环境
  • 评估性能与训练稳定性

强化学习在机器人中的应用

  • 学习控制与运动策略
  • 强化学习在机器人操作中的应用
  • 多智能体强化学习在群体机器人中的应用

优化、部署与真实世界集成

  • 超参数调优与奖励塑造
  • 将学习到的策略从仿真迁移到现实(Sim2Real)
  • 在机器人硬件上部署训练好的模型

总结与下一步

要求

  • 了解机器学习概念
  • 具备Python编程经验
  • 熟悉机器人及控制系统

目标学员

  • 机器学习工程师
  • 机器人研究人员
  • 开发智能机器人系统的开发人员
 21 小时

客户评论 (1)

即将举行的公开课程

课程分类