课程大纲

介绍

  • 通过试错交互解决实际问题

了解自适应学习系统和 Artificial Intelligence (AI)。

智能体如何感知状态

如何奖励代理

案例研究:与网站访问者互动

为代理准备环境

深入了解 Reinforcement Learning 算法

基于价值的方法与基于策略的方法

选择 Reinforcement Learning 型号

使用 Q-Learning 无模型 Reinforcement Learning 算法

设计代理

案例研究:智能助手

将代理连接到生产环境

测量代理操作的结果

故障 排除

总结和结论

要求

  • 对强化学习的一般理解
  • 机器学习经验
  • Java 编程经验

观众

  • 数据科学家
 21 小时

人数



每位参与者的报价

客户评论 (4)

相关课程

课程分类