课程大纲

多智能体系统简介

  • 智能体、环境和交互模型概述。
  • 智能体系统中的协作、竞争和自主性。
  • 在物流、机器人和决策中的应用。

智能体架构的核心概念

  • 反应式与慎思式智能体。
  • 通信协议和协调模型。
  • 知识表示和共享状态。

使用Python实现智能体

  • 使用Mesa框架构建智能体。
  • 建模环境和交互。
  • 模拟智能体行为并进行可视化。

协调与通信

  • 消息传递和共享内存架构。
  • 协商、共识和任务分配。
  • 协调算法(合同网、市场基础、群体模型)。

多智能体系统中的学习与适应

  • 多智能体的强化学习。
  • 协作与竞争的学习动态。
  • 使用PettingZoo和Stable-Baselines3进行多智能体强化学习。

分布式计算与扩展

  • 使用Ray进行分布式多智能体模拟。
  • 管理并发和同步。
  • 并行化计算和处理共享资源。

人-智能体协作

  • 设计人类参与的协调界面。
  • 结合AI辅助决策的混合工作流程。
  • 伦理和操作考虑。

结业项目

  • 使用Python设计和实现一个多智能体系统。
  • 展示智能体之间的协调和学习。
  • 展示模拟结果和性能分析。

总结与下一步

要求

  • 熟练掌握Python编程。
  • 对强化学习或AI智能体设计有较好的理解。
  • 熟悉分布式系统和网络概念。

受众

  • 设计协作或分布式AI系统的系统架构师。
  • 研究协调和集体智能的研究人员。
  • 开发混合人-智能体或多智能体工作流程的工程师。
 28 小时

即将举行的公开课程

课程分类