课程大纲

介绍

  • Kubeflow GCK、本地和其他公有云提供商

GCP 上的 Kubeflow 功能概述

  • 资源的声明式管理
  • 适用于机器学习 (ML) 工作负载的 GKE 自动扩展
  • 与 Jupyter 的安全连接
  • 用于调试和故障排除的持久性日志
  • GPU 和 TPU 可加速工作负载

环境设置概述

  • 虚拟机准备
  • Kubernetes 集群设置
  • Kubeflow 安装

部署 Kubeflow

  • 部署 Kubeflow on GCP
  • 在本地和云环境中部署 Kubeflow
  • 在 GKE 上部署 Kubeflow
  • 在 GKE 上设置自定义域

GCP 上的管道

  • 设置端到端 Kubeflow 管道
  • 自定义 Kubeflow 流水线

保护 Kubeflow 群集

  • 设置身份验证和授权
  • 使用 VPC 服务控制和私有 GKE

存储、Accessing、管理数据

  • 了解共享文件系统和网络连接存储 (NAS)
  • 在 GCE 中使用托管文件存储服务

运行 ML 训练作业

  • 训练 MNIST 模型

管理 Kubeflow

  • 日志记录和监视

故障 排除

总结和结论

要求

  • 对机器学习概念的理解。
  • 了解云计算概念。
  • 对容器 (Docker) 和编排 (Kubernetes) 有大致的了解。
  • 一些 Python 编程经验是有帮助的。
  • 具有使用命令行的经验。

观众

  • 数据科学工程师。
  • DevOps 对机器学习模型部署感兴趣的工程师。
  • 对机器学习模型部署感兴趣的基础结构工程师。
  • 希望将机器学习功能与其应用程序自动集成和部署的软件工程师。
  28 小时
 

人数


开始

完结


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

客户评论 (2)

相关课程

课程分类