课程大纲

介绍

  • Kubeflow on AWS 本地部署与其他公共云提供商的对比

Kubeflow 功能和体系结构概述

激活 AWS 账户

准备和启动启用了 GPU 的 AWS 实例

设置用户角色和权限

准备构建环境

选择 TensorFlow 模型和数据集

将代码和框架打包到 Docker 映像中

使用 EKS 设置 Kubernetes 集群

暂存训练和验证数据

配置 Kubeflow 管道

在 EKS 中使用 Kubeflow 启动训练作业

在运行时可视化训练作业

作业完成后进行清理

故障 排除

总结和结论

要求

  • 对机器学习概念的理解。
  • 了解云计算概念。
  • 对容器 (Docker) 和编排 (Kubernetes) 有大致的了解。
  • 一些 Python 编程经验是有帮助的。
  • 具有使用命令行的经验。

观众

  • 数据科学工程师。
  • DevOps 对机器学习模型部署感兴趣的工程师。
  • 对机器学习模型部署感兴趣的基础结构工程师。
  • 希望将机器学习功能与其应用程序集成和部署的软件工程师。
  28 小时
 

人数


开始

完结


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

相关课程

课程分类