Kubeflow on Azure 培训
Kubeflow 是一个在 Kubernetes 上运行 Machine Learning 工作负载的框架。TensorFlow 是最流行的机器学习库之一。Kubernetes 是一个用于管理容器化应用程序的编排平台。
这种由讲师指导的现场培训(在线或现场)针对的是希望将 Machine Learning 工作负载部署到 Azure 云的工程师。
培训结束后,学员将能够:
- 在 Azure 上安装并配置 Kubernetes、Kubeflow 及其他所需软件。
- 使用 Azure Kubernetes 服务(AKS)简化在 Azure 上初始化 Kubernetes 集群的工作。
- 创建并部署 Kubernetes 管道,用于自动化和管理生产中的 ML 模型。
- 在多个GPU和并行运行的机器上训练和部署TensorFlowML模型。
- 利用其他 AWS 托管服务来扩展 ML 应用程序。
课程形式
- 互动讲座和讨论。
- 大量的练习和实践。
- 在实时实验室环境中进行实际实施。
课程定制选项
- 如需针对本课程进行定制培训,请联系我们安排。
课程大纲
介绍
- Kubeflow 在 Azure 与本地部署相比,与其他公共云提供商相比
Kubeflow 功能和架构概述
部署过程概述
激活 Azure 账户
准备并启动启用了 GPU 的虚拟机
设置用户角色和权限
准备构建环境
选择TensorFlow模型和数据集
将代码和框架打包成 Docker 镜像
使用 AKS 设置 Kubernetes 集群
准备训练和验证数据
配置Kubeflow管道
启动训练工作。
在运行时可视化训练作业
作业完成后进行清理
故障排除
总结
要求
- 了解机器学习概念。
- 了解云计算概念。
- 对容器(Docker)和编排(Kubernetes)的一般理解。
- 一些Python编程经验是有帮助的。
- 具有使用命令行工作的经验。
观众
- 数据科学工程师。
- DevOps 名对机器学习模型部署感兴趣的工程师。
- 对机器学习模型部署感兴趣的基础设施工程师。
- 软件工程师希望自动将机器学习功能与其应用程序集成并部署。
需要帮助选择合适的课程吗?
Kubeflow on Azure 培训 - Enquiry
Kubeflow on Azure - 问询
问询
客户评论 (5)
这完全符合我们的要求,并且内容和练习数量相当均衡,涵盖了公司中参与的工程师的不同情况。
Arturo Sanchez - INAIT SA
课程 - Microsoft Azure Infrastructure and Deployment
机器翻译
I've got to try out resources that I've never used before.
Daniel - INIT GmbH
课程 - Architecting Microsoft Azure Solutions
The Exercises
Khaled Altawallbeh - Accenture Industrial SS
课程 - Azure Machine Learning (AML)
非常友好和乐于助人
Aktar Hossain - Unit4
课程 - Building Microservices with Microsoft Azure Service Fabric (ASF)
机器翻译
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
课程 - MLflow
即将举行的公开课程
相关课程
DeepSeek: Advanced Model Optimization and Deployment
14 小时此针对具有中级至高级经验的高级人工智能工程师和数据科学家的中国(在线或现场)培训课程旨在通过现代MLOps实践有效地提高DeepSeek模型性能、降低延迟和部署人工智能解决方案。
培训结束时,参与者将能够:
- 优化效率、准确性和可伸缩性的DeepSeek模型。
- 实施MLOps和模型版本控制的最佳实践。
- 在云端和本地基础设施上部署DeepSeek模型。
- 有效监控、维护和扩展人工智能解决方案。
Building AI Cloud Apps with Microsoft Azure
35 小时这是一个由讲师指导的现场培训,地点在中国(线上或现场),旨在为中高级专业人士提供使用Microsoft Azure来构建和部署人工智慧驱动的云端应用程式的技能。
在培训结束时,参与者将能够:
- 使用Azure Functions开发事件驱动和无伺服器应用程式。
- 管理Azure的储存解决方案和虚拟机器。
- 使用Azure App Service和Docker容器部署和扩展网页应用程式。
- 使用Azure AI Services整合人工智慧、机器学习和自然语言处理。
- 利用GitHub Copilot协助开发人工智慧驱动的云端应用程式。
Azure Machine Learning (AML)
21 小时这种以讲师为主导的中国现场培训(现场或远程)面向希望使用Azure ML的拖放平台部署Machine Learning工作负载的工程师,而无需购买软件和硬件,也不必担心维护和部署。
在培训结束时,参与者将能够:
- 使用 Python、R 或零代码工具编写高精度的机器学习模型。
- 利用 Azure 的可用数据集和算法来训练和跟踪机器学习和深度学习模型。
- 使用 Azure 的交互式工作区协作开发 ML 模型。
- 从不同的 Azure 支持的 ML 框架中进行选择,例如 PyTorch、TensorFlow 和 scikit-learn。
Architecting Microsoft Azure Solutions
14 小时该培训允许代表提高他们的 Microsoft Azure 解决方案设计技能。
在本次培训之后,学员将了解 Azure 服务的特性和功能,以便能够识别权衡,并做出设计公共云和混合云解决方案的决策。
在培训期间,将定义适当的基础设施和平台解决方案,以满足整个解决方案生命周期中所需的功能、操作和部署要求。
Azure DevOps Fundamentals
14 小时这种以讲师为主导的中国现场(现场或远程)的现场培训面向 DevOps 希望利用 Azure DevOps 比传统开发方法更快地构建和部署优化的企业应用程序的工程师、开发人员和项目经理。
在培训结束时,参与者将能够:
- 了解基本的 DevOps 词汇和原则。
- 安装和配置软件开发所需的 Azure DevOps 工具。
- 利用 Azure DevOps 工具和服务不断适应市场。
- 在 Azure DevOps 解决方案上构建企业应用程序并评估当前的开发流程。
- 更高效地管理团队并缩短软件部署时间。
- 在组织内采用 DevOps 开发实践。
Azure Machine Learning
14 小时这种以讲师为主导的中国现场培训(现场或远程)针对希望使用Azure Machine Learning构建用于预测分析的端到端机器学习模型的数据科学家。
在培训结束时,参与者将能够:
- 构建零编程经验的机器学习模型。
- 使用 Azure Machine Learning 创建预测算法。
- 部署生产就绪的机器学习算法。
Building Microservices with Microsoft Azure Service Fabric (ASF)
21 小时此讲师指导的 中国(在线或现场)实时培训面向希望学习如何在 Microsoft Azure Service Fabric (ASF) 上构建微服务的开发人员。
在培训结束时,参与者将能够:
- 使用 ASF 作为构建和管理微服务的平台。
- 了解关键的微服务编程概念和模型。
- 在 Azure 中创建集群。
- 在本地或云中部署微服务。
- 对实时微服务应用程序进行调试和故障排除。
Kubeflow
35 小时这种以讲师为主导的中国现场培训(现场或远程)面向希望在Kubernetes上构建,部署和管理机器学习工作流的开发人员和数据科学家。
在培训结束时,参与者将能够:
- 使用 AWS EKS(弹性 Kubernetes 服务)在本地和云端安装和配置 Kubeflow。
- 基于 Docker 个容器和 Kubernetes 构建、部署和管理 ML 工作流。
- 在不同的架构和云环境中运行整个机器学习管道。
- 使用 Kubeflow 生成和管理 Jupyter 笔记本。
- 跨多个平台构建 ML 训练、超参数调优并为工作负载提供服务。
Kubeflow Fundamentals
28 小时这种以讲师为主导的中国现场培训(现场或远程)面向希望在Kubernetes上构建,部署和管理机器学习工作流的开发人员和数据科学家。
在培训结束时,参与者将能够:
- 在本地和云端安装和配置 Kubeflow。
- 基于 Docker 个容器和 Kubernetes 构建、部署和管理 ML 工作流。
- 在不同的架构和云环境中运行整个机器学习管道。
- 使用 Kubeflow 生成和管理 Jupyter 笔记本。
- 跨多个平台构建 ML 训练、超参数调优并为工作负载提供服务。
Kubeflow on AWS
28 小时这种由讲师指导的中国现场现场培训面向希望将Machine Learning工作负载部署到AWS EC2服务器的工程师。
在培训结束时,参与者将能够:
- 在 AWS 上安装和配置 Kubernetes、Kubeflow 和其他需要的软件。
- 使用 EKS(Elastic Kubernetes Service)简化在 AWS 上初始化 Kubernetes 集群的工作。
- 创建和部署 Kubernetes 管道,用于在生产环境中自动执行和管理 ML 模型。
- 在多个并行运行的 GPU 和机器上训练和部署 TensorFlow ML 模型。
- 利用其他 AWS 托管服务来扩展 ML 应用程序。
MLflow
21 小时这种以讲师为主导的现场培训(现场或远程)针对的是希望超越构建ML模型并优化ML模型创建,跟踪和部署过程的数据科学家。
在培训结束时,参与者将能够:
- 安装和配置 MLflow 以及相关的 ML 库和框架。
- 了解 ML 模型的可跟踪性、可再现性和可部署性的重要性
- 将 ML 模型部署到不同的公有云、平台或本地服务器。
- 扩展 ML 部署过程,以适应在项目上进行协作的多个用户。
- 设置中央注册表以试验、复制和部署 ML 模型。
MLOps: CI/CD for Machine Learning
35 小时这种以讲师为主导的中国现场培训(现场或远程)针对的是希望评估当今可用的方法和工具的工程师,以便就在其组织内采用MLOps的前进道路做出明智的决定。
在培训结束时,参与者将能够:
- 安装和配置各种 MLOps 框架和工具。
- 组建一支具有正确技能的正确团队,以构建和支持 MLOps 系统。
- 准备、验证和版本控制数据以供 ML 模型使用。
- 了解 ML 管道的组件以及构建管道所需的工具。
- 尝试使用不同的机器学习框架和服务器进行部署到生产环境。
- 操作整个 Machine Learning 过程,使其可复制和维护。
MLOps for Azure Machine Learning
14 小时这种以讲师为主导的现场培训(现场或远程)针对希望使用Azure Machine Learning和Azure DevOps来促进MLOps实践的机器学习工程师。
在培训结束时,参与者将能够:
- 构建可重现的工作流和机器学习模型。
- 管理机器学习生命周期。
- 跟踪和报告模型版本历史记录、资产等。
- 在任何地方部署生产就绪的机器学习模型。