Kubeflow on AWS 培训
其次,在《古兰经》中,《古兰经》的《古兰经》中,《古兰经》的《古兰经》是《古兰经》的《古兰经》。 TensorFlow是机械学习图书馆, Kubernetes是管理集装应用的乐队平台。
由教练领导的现场培训(在线或在线)旨在针对那些希望在 AWS EC2 服务器上部署 Machine Learning 工作负载的工程师。
在本研讨会结束后,参与者将能够:
- 在 AWS 上安装和配置 Kubernetes、 Kubeflow 和其他必要的软件。
- 使用 EKS (Elastic Kubernetes Service) 简化在 AWS 上启动一个 Kubernetes 集群的工作。
- 创建和部署一个 Kubernetes 管道,用于自动化和管理生产中的 ML 模型。
- 训练和部署2ML模型在多个3s和机器运行平行。
- 提供其他 AWS 管理服务,以扩展 ML 应用程序。
课程格式
- 互动讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中进行手动实施。
课程定制选项
- 要申请此课程的定制培训,请联系我们安排。
课程大纲
介绍
- Kubeflow on AWS 本地部署与其他公共云提供商的对比
Kubeflow 功能和体系结构概述
激活 AWS 账户
准备和启动启用了 GPU 的 AWS 实例
设置用户角色和权限
准备构建环境
选择 TensorFlow 模型和数据集
将代码和框架打包到 Docker 映像中
使用 EKS 设置 Kubernetes 集群
暂存训练和验证数据
配置 Kubeflow 管道
在 EKS 中使用 Kubeflow 启动训练作业
在运行时可视化训练作业
作业完成后进行清理
故障 排除
总结和结论
要求
- 对机器学习概念的理解。
- 了解云计算概念。
- 对容器 (Docker) 和编排 (Kubernetes) 有大致的了解。
- 一些 Python 编程经验是有帮助的。
- 具有使用命令行的经验。
观众
- 数据科学工程师。
- DevOps 对机器学习模型部署感兴趣的工程师。
- 对机器学习模型部署感兴趣的基础结构工程师。
- 希望将机器学习功能与其应用程序集成和部署的软件工程师。
需要帮助选择合适的课程吗?
Kubeflow on AWS 培训 - Enquiry
Kubeflow on AWS - 问询
问询
客户评论 (3)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
课程 - MLflow
All good, nothing to improve
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
课程 - AWS Lambda for Developers
IOT applications
Palaniswamy Suresh Kumar - Makers' Academy
课程 - Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
即将举行的公开课程
相关课程
Advanced Amazon Web Services (AWS) CloudFormation
7 小时此讲师指导式现场培训在 中国(在线或现场)进行,面向希望使用 CloudFormation 管理 AWS 生态系统内基础设施资源的云工程师和开发人员。
在本次培训结束时,参与者将能够:
- 实施 CloudFormation 范本以自动化基础设施管理。
- 将现有 AWS 资源整合到 CloudFormation 中。
- 使用 StackSets 管理跨多个帐户和区域的堆叠。
DeepSeek: Advanced Model Optimization and Deployment
14 小时此针对具有中级至高级经验的高级人工智能工程师和数据科学家的中国(在线或现场)培训课程旨在通过现代MLOps实践有效地提高DeepSeek模型性能、降低延迟和部署人工智能解决方案。
培训结束时,参与者将能够:
- 优化效率、准确性和可伸缩性的DeepSeek模型。
- 实施MLOps和模型版本控制的最佳实践。
- 在云端和本地基础设施上部署DeepSeek模型。
- 有效监控、维护和扩展人工智能解决方案。
Amazon DynamoDB for Developers
14 小时此讲师指导的现场培训在 中国(在线或现场)进行,面向希望将 DynamoDB NoSQL 资料库集成到 AWS 上托管的 Web 应用程式的开发人员。
在本次培训结束时,参与者将能够:
- 设置必要的开发环境以开始将数据集成到 DynamoDB 中。
- 将 DynamoDB 整合到 Web 应用程式和行动应用程式中。
- 使用 AWS 服务在 AWS 中行动资料。
- 使用 AWS DAX 实施 操作。
AWS IoT Core
14 小时这种以讲师为主导的 中国(现场或远端)现场培训 面向希望在AWS上部署和管理物联网设备的工程师。
在本次培训结束时,参与者将能够构建一个物联网平台,其中包括在 AWS 之上部署和管理后端、网关和设备。
Amazon Web Services (AWS) IoT Greengrass
21 小时这种以讲师为主导的中国现场培训(现场或远端)针对希望安装,配置和管理AWS IoT Greengrass功能以创建各种设备的应用程式的开发人员。
在本次培训结束时,参与者将能够使用 AWS IoT Greengrass 在智慧设备上构建、部署、管理、保护和监控应用程式。
AWS Lambda for Developers
14 小时这种由 讲师指导的 中国 现场(现场或远端)实时培训 面向希望使用 AWS Lambda 构建服务和应用程式并将其部署到云中的开发人员,而无需担心配置执行环境(伺服器、VM 和容器、可用性、可扩充性、存储等)。
在本次培训结束时,参与者将能够:
- 配置 AWS Lambda 以执行函数。
- 了解 FaaS (Functions as a Service) 和无伺服器开发的优势。
- 构建、上传和执行 AWS Lambda 函数。
- 将 Lambda 函数与不同的事件源集成。
- 打包、部署、监控基于 Lambda 的应用程式并对其进行故障排除。
AWS CloudFormation
7 小时这种由讲师指导的中国现场现场培训面向希望使用AWS CloudFormation自动管理AWS云基础设施过程的工程师。
在培训结束时,参与者将能够:
- 启用 AWS 服务以开始管理基础设施。
- 理解并应用“基础设施即程式码”的原则。
- 提高品质并降低部署基础架构的成本。
- 使用 YAML 编写 AWS CloudFormation 样本。
Mastering DevOps with AWS Cloud9
21 小时这项由 讲师指导的现场培训中国(在线或现场)面向希望加深对 DevOps 实践的理解并使用 AWS Cloud9 简化开发流程的高级专业人员。
在本次培训结束时,参与者将能够:
- 为 DevOps 个工作流设置和配置 AWS Cloud9。
- 实施持续集成和持续交付 (CI/CD) 管道。
- 使用 AWS Cloud9 自动执行测试、监控和部署流程。
- 将 Lambda、EC2 和 S3 等 AWS 服务整合到 DevOps 工作流中。
- 在 AWS Cloud9 中使用原始程式码控制系统,如 GitHub 或 GitLab。
Developing Serverless Applications on AWS Cloud9
14 小时这种以讲师指导的现场培训<本地>(在线或现场)面向希望学习如何在AWS Cloud9 和 AWS Lambda 上有效构建、部署和维护无伺服器应用程式的中级专业人员。
在本次培训结束时,参与者将能够:
- 了解无伺服器架构的基础知识。
- 设置 AWS Cloud9 以进行无伺服器应用程式开发。
- 使用 AWS Lambda 开发、测试和部署无伺服器应用程式。
- 与其他 AWS 服务(如 API Gateway 和 S3)集成。
- 优化无伺服器应用程式以提高性能和成本效率。
Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
4 小时总结:
- 物联网架构和功能的基础知识
- “物”、“感测器”、互联网和物联网业务功能之间的映射
- 所有物联网软体元件的基本要素 - 硬体、韧体、中间件、云端和行动应用程式
- 物联网功能 - 车队管理器、数据可视化、基于 SaaS 的 FM 和 DV、警报/警报、感测器入职、“事物”入职、地理围栏
- 使用 MQTT 与云端进行物联网设备通信的基础知识。
- 使用 MQTT (AWS IoT Core) 将 IoT 设备连接到 AWS。
- 将 AWS IoT 内核与 AWS Lambda 功能连接,用于计算和数据存储。
- 连接具有 AWS IoT 核心和简单数据通信的Raspberry PI。
- 警报和事件
- 感测器校准
Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「8 Hours Remote」
8 小时总结:
- 物联网架构和功能的基础知识
- “物”、“感测器”、互联网和物联网业务功能之间的映射
- 所有物联网软体元件的基本要素 - 硬体、韧体、中间件、云端和行动应用程式
- 物联网功能 - 车队管理器、数据可视化、基于 SaaS 的 FM 和 DV、警报/警报、感测器入职、“事物”入职、地理围栏
- 使用 MQTT 与云端进行物联网设备通信的基础知识。
- 使用 MQTT (AWS IoT Core) 将 IoT 设备连接到 AWS。
- 将 AWS IoT 核心与 AWS Lambda 函数连接,以使用 DynamoDB 进行计算和数据存储。
- 连接具有 AWS IoT 核心和简单数据通信的Raspberry PI。
- 动手使用Raspberry PI和 AWS IoT Core 构建智慧设备。
- 感测器数据可视化和与网路介面的通信。
Kubeflow on Azure
28 小时此由讲师指导的现场培训(在线或现场)主要针对希望将 Machine Learning 工作负载部署到 Azure 云的工程师。
培训结束后,学员将能够:
- 在 Azure 上安装并配置 Kubernetes、Kubeflow 及其他所需软件。
- 使用 Azure Kubernetes 服务(AKS)简化在 Azure 上初始化 Kubernetes 集群的工作。
- 创建并部署 Kubernetes 管道,用于自动化和管理生产中的 ML 模型。
- 在多个GPU和并行运行的机器上训练和部署TensorFlowML模型。
- 利用其他 AWS 托管服务来扩展 ML 应用程序。
MLflow
21 小时这种以讲师为主导的现场培训(现场或远程)针对的是希望超越构建ML模型并优化ML模型创建,跟踪和部署过程的数据科学家。
在培训结束时,参与者将能够:
- 安装和配置 MLflow 以及相关的 ML 库和框架。
- 了解 ML 模型的可跟踪性、可再现性和可部署性的重要性
- 将 ML 模型部署到不同的公有云、平台或本地服务器。
- 扩展 ML 部署过程,以适应在项目上进行协作的多个用户。
- 设置中央注册表以试验、复制和部署 ML 模型。
MLOps: CI/CD for Machine Learning
35 小时这种以讲师为主导的中国现场培训(现场或远程)针对的是希望评估当今可用的方法和工具的工程师,以便就在其组织内采用MLOps的前进道路做出明智的决定。
在培训结束时,参与者将能够:
- 安装和配置各种 MLOps 框架和工具。
- 组建一支具有正确技能的正确团队,以构建和支持 MLOps 系统。
- 准备、验证和版本控制数据以供 ML 模型使用。
- 了解 ML 管道的组件以及构建管道所需的工具。
- 尝试使用不同的机器学习框架和服务器进行部署到生产环境。
- 操作整个 Machine Learning 过程,使其可复制和维护。
MLOps for Azure Machine Learning
14 小时这种以讲师为主导的现场培训(现场或远程)针对希望使用Azure Machine Learning和Azure DevOps来促进MLOps实践的机器学习工程师。
在培训结束时,参与者将能够:
- 构建可重现的工作流和机器学习模型。
- 管理机器学习生命周期。
- 跟踪和报告模型版本历史记录、资产等。
- 在任何地方部署生产就绪的机器学习模型。