课程大纲

介绍

  • Horovod 功能和概念概述
  • 了解支援的框架

安装和设定 Horovod

  • 准备托管环境    
  • 为 TensorFlow、Keras、PyTorch 和 Apache MXNet 构建 Horovod
  • 正在执行 Horovod

运行分散式训练

  • 使用 TensorFlow 修改和运行训练范例
  • 使用 Keras 修改和运行训练范例
  • 使用 Py 修改和运行训练范例Torch
  • 使用 Apache MXNet 修改和运行训练范例

优化分散式训练过程

  • 在多个GPU    上运行并发操作
  • 优化超参数
  • 启用性能自动调整

故障排除

总结和结论

要求

  • 理解 Machine Learning,特别是深度学习
  • 熟悉机器学习库(TensorFlow、Keras、PyTorch、Apache MXNet)
  • Python 程式设计经验

观众

  • 开发人员
  • 数据科学家
 7 小时

即将举行的公开课程

课程分类