课程大纲

介绍

  • Kubeflow 在 AWS 上 vs 本地 vs 其他公有云提供商

Kubeflow 功能与架构概述

激活 AWS 账户

准备并启动支持 GPU 的 AWS 实例

设置用户角色和权限

准备构建环境

选择 TensorFlow 模型和数据集

将代码和框架打包到 Docker 镜像中

使用 EKS 设置 Kubernetes 集群

暂存训练和验证数据

配置 Kubeflow 流水线

使用 Kubeflow 在 EKS 中启动训练任务

实时可视化训练任务

任务完成后的清理工作

故障排除

总结与结论

要求

  • 了解机器学习概念。
  • 具备云计算概念知识。
  • 对容器(Docker)和编排(Kubernetes)有基本了解。
  • 有一定的 Python 编程经验会有所帮助。
  • 具备命令行操作经验。

目标受众

  • 数据科学工程师。
  • 对机器学习模型部署感兴趣的 DevOps 工程师。
  • 对机器学习模型部署感兴趣的基础设施工程师。
  • 希望集成并部署机器学习功能的软件工程师。
 28 小时

客户评论 (3)

即将举行的公开课程

课程分类