课程大纲
介绍
- SRE如何结合传统IT和软件开发。
- 自动化和可观测性的必要性
- 软件工程师与系统管理员的角色对比。
- 站点可靠性工程师与DevOps工程师的对比。
IT系统概述
- 系统架构,包括本地和云端。
SRE原则与实践概述
- 基础设施即代码。
- 容器化与编排的作用(Docker、Kubernetes等)
- 持续集成、持续部署与持续交付。
- 可观测性。
评估IT系统
- 盘点团队和组织资源。
- 绘制系统和流程图。
- 评估SRE的潜在影响。
- 软件工程团队的角色。
- 运营团队的角色。
- 管理层的角色。
维护系统的可靠性
- 描述和衡量服务的期望可靠性。
- 理解服务级别目标(SLOs)
- 理解服务级别指标(SLIs)和服务级别协议(SLAs)。
- 处理错误预算。
- 制定SLO。
优化系统管理
- 设置开发环境
- 评估SRE工具
- 优先考虑自动化任务。
- 编写软件。
部署“基础设施即代码”
- 测试和迭代代码
- 使系统具备抗脆弱性
- 从失败中学习
监控系统
- 观察系统性能。
- SRE工具和技术。
SRE的未来
总结与结论
要求
- 对IT基础设施有基本了解。
- 对软件开发流程有基本概念。
- 具备任何编程或脚本语言的经验。
受众
- 开发者
- 系统管理员
- 软件架构师
- DevOps工程师
- IT经理
客户评论 (7)
如何通过真实世界的例子详细解释主题
Brian Hlabane - African Bank
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译
她在该领域非常专业,提供的培训非常出色。培训材料结合了实例、讨论和
Peter Tutka - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译
从更偏向业务/理论的角度来看待SRE/DevOps。对于已经具备实践视角的人来说,这部分内容最有帮助。
Michael Varhol - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译
培训前发送问卷的方式,使培训能够根据期望进行规划,让参与者更加积极参与。
Stefan Girman - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译
坚持根据学员的初始调查结果,确定培训的重点。
Denis Majorsky - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译
讨论,SRE定义
Daniel Horvath - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译
培训的概念是通过提问和引发讨论来保持学员的专注。此外,分组讨论环节非常有助于团队思考问题,并看到其他小组的不同结果。
Blazej Farkas - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译