Kubernetes上的AI工作负载：大规模部署机器学习模型培训

(5 客户评论)

Kubernetes是一个可扩展的平台，用于在生产环境中部署、服务和管理机器学习模型。

本课程为讲师主导的培训（线上或线下），面向希望可靠地在Kubernetes上操作ML模型的中级专业人员。

完成本培训后，参与者将掌握以下技能：

容器化并准备ML模型以进行高效部署。
使用现代推理框架服务模型。
通过自动扩展、GPU配置和资源调优来优化工作负载。
实施模型发布策略，如A/B测试和金丝雀部署。

课程形式

混合讲座、架构分析和引导讨论。
大量实践练习，涵盖实际部署场景。
在实时Kubernetes环境中进行动手实践。

课程定制选项

如果您需要根据您的环境或工具链定制本课程，请联系我们讨论定制选项。

感谢您发送咨询！我们的团队成员将很快与您联系。

感谢您发送预订！我们的团队成员将很快与您联系。

课程大纲

准备机器学习模型进行部署

使用Docker打包模型
从TensorFlow和PyTorch导出模型
版本控制和存储注意事项

在Kubernetes上服务模型

推理服务器概述
部署TensorFlow Serving和TorchServe
设置模型端点

推理优化技术

批处理策略
并发请求处理
延迟和吞吐量调优

自动扩展ML工作负载

水平Pod自动扩展器（HPA）
垂直Pod自动扩展器（VPA）
Kubernetes事件驱动自动扩展（KEDA）

GPU配置和资源管理

配置GPU节点
NVIDIA设备插件概述
ML工作负载的资源请求和限制

模型发布和发布策略

蓝/绿部署
金丝雀发布模式
用于模型评估的A/B测试

生产环境中的ML监控和可观测性

推理工作负载的指标
日志记录和跟踪实践
仪表板和告警

安全性和可靠性考虑

保护模型端点
网络策略和访问控制
确保高可用性

总结与下一步

要求

了解容器化应用的工作流程
有使用Python机器学习模型的经验
熟悉Kubernetes基础知识

受众

ML工程师
DevOps工程师
平台工程团队

14 小时

需要帮助选择合适的课程吗？

客户评论 (5)

他很有耐心，明白我们落后了

Albertina - REGNOLOGY ROMANIA S.R.L.

课程 - Deploying Kubernetes Applications with Helm

机器翻译

How Interactive Reda would explain the information and get us to participate. He would also mention interesting facts along the way and share all the knowledge he has. Reda has excellent communication skills which makes online training really effective.

Kubernetes上的AI工作负载：大规模部署机器学习模型培训

课程大纲

要求

客户评论 (5)

Albertina - REGNOLOGY ROMANIA S.R.L.

课程 - Deploying Kubernetes Applications with Helm

Janine - BMW SA

课程 - Kubernetes Advanced

Siphokazi Biyana - Vodacom SA

课程 - Kubernetes on AWS

Felix Bautista - SGS GULF LIMITED ROHQ

课程 - Kubernetes on Azure (AKS)

Stephen Dowdeswell - Global Knowledge Networks UK

课程 - Docker (introducing Kubernetes)

即将举行的公开课程

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

课程分类

该网站在其他国家/地区

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Kubernetes上的AI工作负载：大规模部署机器学习模型 培训

课程大纲

要求

客户评论 (5)

Albertina - REGNOLOGY ROMANIA S.R.L.

课程 - Deploying Kubernetes Applications with Helm

Janine - BMW SA

课程 - Kubernetes Advanced

Siphokazi Biyana - Vodacom SA

课程 - Kubernetes on AWS

Felix Bautista - SGS GULF LIMITED ROHQ

课程 - Kubernetes on Azure (AKS)

Stephen Dowdeswell - Global Knowledge Networks UK

课程 - Docker (introducing Kubernetes)

即将举行的公开课程

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

Kubernetes上的AI工作负载：大规模部署机器学习模型

相关课程

DO180：容器、Kubernetes与OpenShift入门

针对系统管理员的Docker、Kubernetes、OpenShift

Docker和Kubernetes：构建和缩放容器化应用程序

Docker（介绍Kubernetes）

Docker and Kubernetes

Docker、Kubernetes 和 OpenShift 3 开发者课程

使用Helm部署Kubernetes应用

Kubernetes：基础到高级

Kubernetes 高级课程

Kubernetes on AWS

Azure上的Kubernetes（AKS）

Kubernetes设计模式

Minikube 和 Kubernetes 简介

Minikube 开发者课程

Rancher：管理你的Docker容器

课程分类

Kubernetes

该网站在其他国家/地区

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Kubernetes上的AI工作负载：大规模部署机器学习模型培训