课程大纲

课程介绍

  • 课程目标
  • 课程议程

模块1:SRE原则与实践

  • 什么是站点可靠性工程?
  • SRE与DevOps:有何不同?
  • SRE原则与实践

模块2:服务级别目标与错误预算

  • 服务级别目标(SLO)
  • 错误预算
  • 错误预算策略

模块3:减少繁琐工作

  • 什么是繁琐工作?
  • 为什么繁琐工作有害?
  • 如何处理繁琐工作

模块4:监控与服务级别指标

  • 服务级别指标(SLI)
  • 监控
  • 可观测性

模块5:SRE工具与自动化

  • 自动化的定义
  • 自动化的重点
  • 自动化类型的层次结构
  • 安全自动化
  • 自动化工具

模块6:抗脆弱性与从失败中学习

  • 为什么从失败中学习
  • 抗脆弱性的好处
  • 组织平衡的转变

模块7:SRE的组织影响

  • 为什么组织采用SRE
  • SRE采用的模式
  • 随叫随到的必要性
  • 无责事后分析
  • SRE与规模

模块8:SRE、其他框架与未来

  • SRE与其他框架
  • 未来展望

额外信息源

考试准备

  • 考试要求、问题权重及术语列表
  • 样题回顾

要求

先决条件

建议具备对常见DevOps术语和概念的理解与相关知识,以及相关工作经验。

目标受众

SRE Foundation课程的目标受众包括以下专业人员:

  • 任何开始或领导提升可靠性工作的人员
  • 对现代IT领导力和组织变革方法感兴趣的人员
  • 业务经理
  • 业务利益相关者
  • 变革推动者
  • 顾问
  • DevOps从业者
  • IT总监
  • IT经理
  • IT团队负责人
  • 产品负责人
  • Scrum Master
  • 软件工程师
  • 站点可靠性工程师
  • 系统集成商
  • 工具提供商
 14 小时

客户评论 (5)

即将举行的公开课程

课程分类