课程大纲

介绍

  • SRE 如何将传统 IT 和软件开发相结合。
  • 对自动化和可观察性的需求
  • 软件工程师与系统管理员的角色。
  • 站点可靠性工程师与 DevOps 工程师。

IT 系统概述

  • 系统架构,本地和云端。

SRE 原则和实践概述

  • 基础架构即代码。
  • 容器化和编排的作用(Docker、Kubernetes 等)
  • 持续集成、持续部署和持续交付。
  • 可观察性。

评估 IT 系统

  • 评估团队和组织资源。
  • 规划系统和流程。
  • 估计 SRE 的潜在影响。
  • 软件工程团队的角色。
  • 运营团队的角色。
  • 管理的作用。

维护系统的可靠性

  • 描述和衡量服务所需的可靠性。
  • 了解服务级别目标 (SLO)
  • 了解服务级别指标 (SLI) 和服务级别协议 (SLA)。
  • 使用错误预算。
  • 开发 SLO。

优化系统管理

  • 设置开发环境
  • 评估 SRE 工具
  • 确定任务的优先级以实现自动化。
  • 编写软件。

部署“基础架构即代码”

  • 测试和迭代代码
  • 使系统具有抗脆弱性
  • 从失败中吸取教训

监视系统

  • 观察系统性能。
  • SRE 工具和技术。

SRE 的未来

总结和结论

要求

  • 对 IT 基础架构有大致的了解。
  • 软件开发过程的一般概念。
  • Programming 或任何语言的脚本编写经验。

观众

  • 开发 人员
  • 系统管理员
  • 软件架构师
  • DevOps 工程师
  • IT 经理
  21 小时

人数



每位参与者的报价

客户评论 (1)

相关课程

课程分类