Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
课程大纲
介绍
- SRE 如何将传统 IT 和软件开发相结合。
- 对自动化和可观察性的需求
- 软件工程师与系统管理员的角色。
- 站点可靠性工程师与 DevOps 工程师。
IT 系统概述
- 系统架构,本地和云端。
SRE 原则和实践概述
- 基础架构即代码。
- 容器化和编排的作用(Docker、Kubernetes 等)
- 持续集成、持续部署和持续交付。
- 可观察性。
评估 IT 系统
- 评估团队和组织资源。
- 规划系统和流程。
- 估计 SRE 的潜在影响。
- 软件工程团队的角色。
- 运营团队的角色。
- 管理的作用。
维护系统的可靠性
- 描述和衡量服务所需的可靠性。
- 了解服务级别目标 (SLO)
- 了解服务级别指标 (SLI) 和服务级别协议 (SLA)。
- 使用错误预算。
- 开发 SLO。
优化系统管理
- 设置开发环境
- 评估 SRE 工具
- 确定任务的优先级以实现自动化。
- 编写软件。
部署“基础架构即代码”
- 测试和迭代代码
- 使系统具有抗脆弱性
- 从失败中吸取教训
监视系统
- 观察系统性能。
- SRE 工具和技术。
SRE 的未来
总结和结论
要求
- 对 IT 基础架构有大致的了解。
- 软件开发过程的一般概念。
- Programming 或任何语言的脚本编写经验。
观众
- 开发 人员
- 系统管理员
- 软件架构师
- DevOps 工程师
- IT 经理
21 小时
客户评论 (1)
如何用真实世界的例子解释详细的主题
Brian Hlabane - African Bank
课程 - Site Reliability Engineering (SRE) Fundamentals
机器翻译