课程大纲
介绍
- Kubeflow on Azure 本地部署与其他公有云提供商
Kubeflow 功能和体系结构概述
部署过程概述
激活 Azure 帐户
准备和启动启用了 GPU 的虚拟机
设置用户角色和权限
准备构建环境
选择 TensorFlow 模型和数据集
将代码和框架打包到 Docker 映像中
使用 AKS 设置 Kubernetes 群集
暂存训练和验证数据
配置 Kubeflow 流水线
启动训练作业。
在运行时可视化训练作业
作业完成后进行清理
故障 排除
总结和结论
要求
- 对机器学习概念的理解。
- 了解云计算概念。
- 对容器 (Docker) 和编排 (Kubernetes) 有大致的了解。
- 一些 Python 编程经验是有帮助的。
- 具有使用命令行的经验。
观众
- 数据科学工程师。
- DevOps 对机器学习模型部署感兴趣的工程师。
- 对机器学习模型部署感兴趣的 基础架构工程师。
- 希望将机器学习功能与其应用程序自动集成和部署的软件工程师。
客户评论 (3)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
课程 - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life™
课程 - Kubeflow
The course, Trainer