感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
Reinforcement Learning 简介
- 什么是强化学习?
- 关键概念:智能体、环境、状态、动作和奖励
- 强化学习中的挑战
探索与利用
- 在RL模型中平衡探索与利用
- 探索策略:epsilon-greedy、softmax等
Q学习与深度Q网络(DQNs)
- Q学习简介
- 使用TensorFlow实现DQNs
- 通过经验回放和目标网络优化Q学习
基于策略的方法
- 策略梯度算法
- REINFORCE算法及其实现
- 演员-评论家方法
使用OpenAI Gym
- 在OpenAI Gym中设置环境
- 在动态环境中模拟智能体
- 评估智能体性能
高级Reinforcement Learning技术
- 多智能体强化学习
- 深度确定性策略梯度(DDPG)
- 近端策略优化(PPO)
部署Reinforcement Learning模型
- 强化学习的实际应用
- 将RL模型集成到生产环境中
总结与下一步
要求
- 具备Python编程经验
- 对深度学习和机器学习概念有基本了解
- 了解强化学习中使用的算法和数学概念
受众
- 数据科学家
- 机器学习从业者
- AI研究人员
28 小时