课程大纲
介绍
- Kubeflow GCK、本地和其他公有云提供商
GCP 上的 Kubeflow 功能概述
- 资源的声明式管理
- 适用于机器学习 (ML) 工作负载的 GKE 自动扩展
- 与 Jupyter 的安全连接
- 用于调试和故障排除的持久性日志
- GPU 和 TPU 可加速工作负载
环境设置概述
- 虚拟机准备
- Kubernetes 集群设置
- Kubeflow 安装
部署 Kubeflow
- 部署 Kubeflow on GCP
- 在本地和云环境中部署 Kubeflow
- 在 GKE 上部署 Kubeflow
- 在 GKE 上设置自定义域
GCP 上的管道
- 设置端到端 Kubeflow 管道
- 自定义 Kubeflow 流水线
保护 Kubeflow 群集
- 设置身份验证和授权
- 使用 VPC 服务控制和私有 GKE
存储、Accessing、管理数据
- 了解共享文件系统和网络连接存储 (NAS)
- 在 GCE 中使用托管文件存储服务
运行 ML 训练作业
- 训练 MNIST 模型
管理 Kubeflow
- 日志记录和监视
故障 排除
总结和结论
要求
- 对机器学习概念的理解。
- 了解云计算概念。
- 对容器 (Docker) 和编排 (Kubernetes) 有大致的了解。
- 一些 Python 编程经验是有帮助的。
- 具有使用命令行的经验。
观众
- 数据科学工程师。
- DevOps 对机器学习模型部署感兴趣的工程师。
- 对机器学习模型部署感兴趣的基础结构工程师。
- 希望将机器学习功能与其应用程序自动集成和部署的软件工程师。
客户评论 (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
课程 - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.