课程大纲

介绍

  • Kubernetes 简介
  • Kubeflow 功能和体系结构概述
  • Kubeflow 在 AWS 上、本地上、在其他公共云提供商上

使用 AWS EKS 设置集群

使用 Microk8s 设置本地集群

使用 GitOps 方法部署 Kubernetes

数据存储方法

创建 Kubeflow 管道

触发管道

定义输出工件

存储数据集和模型的元数据

使用 TensorFlow 进行超参数调优

可视化和分析结果

多GPU培训

创建用于部署 ML 模型的推理服务器

使用 JupyterHub

Networking 和负载均衡

自动扩展 Kubernetes 集群

故障 排除

总结和结论

要求

  • 熟悉 Python 语法 
  • 具有 Tensorflow、PyTorch 或其他机器学习框架的经验
  • 具有必要资源的 AWS 账户

观众

  • 开发 人员
  • 数据科学家
 35 小时

客户评论 (1)

即将举行的公开课程

课程分类