联系我们

AIOps基础：监控、关联与智能告警培训

AIOps（IT运营的人工智能）是一种应用机器学习和分析技术来自动化并改进IT运营的实践，特别是在监控、事件检测和响应方面。

本课程为讲师指导的培训（线上或线下），面向中级IT运营专业人员，旨在帮助他们实施AIOps技术，关联指标和日志，减少告警噪音，并通过智能自动化提高可观测性。

培训结束后，学员将能够：

理解AIOps平台的原理和架构。
通过日志、指标和跟踪数据关联，识别根本原因。
通过智能过滤和噪音抑制，减少告警疲劳。
使用开源或商业工具，自动监控和响应事件。

课程形式

互动讲座与讨论。
大量练习与实践。
在实时实验室环境中进行实操。

课程定制选项

如需为本课程定制培训，请联系我们安排。

感谢您发送咨询！我们的团队成员将很快与您联系。

感谢您发送预订！我们的团队成员将很快与您联系。

课程大纲

AIOps简介

AIOps是什么及其重要性
传统监控与AIOps驱动的可观测性对比
AIOps架构及关键组件

收集与规范化运营数据

可观测数据类型：指标、日志和跟踪
从多个来源（服务器、容器、云）摄取数据
使用代理和导出器（Prometheus、Beats、Fluentd）

数据关联与异常检测

时间序列关联与统计方法
使用机器学习模型进行异常检测
检测分布式系统中的事件

告警与噪音减少

设计智能告警规则和阈值
抑制、去重与告警分组
与Alertmanager、Slack、PagerDuty或Opsgenie集成

根本原因分析与可视化

使用仪表板可视化指标并检测趋势
探索事件与时间线以进行根本原因分析（RCA）
使用分布式跟踪工具跨层追踪问题

自动化与修复

从事件触发自动化脚本或工作流
与ITSM系统（ServiceNow、Jira）集成
用例：自愈、扩展、流量重定向

开源与商业AIOps平台

工具概览：Prometheus、Grafana、ELK、Moogsoft、Dynatrace
选择AIOps平台的评估标准
所选技术栈的演示与实操

总结与下一步

要求

了解IT运营和系统监控概念
具备监控工具或仪表板的使用经验
熟悉基本的日志和指标格式

受众

负责基础设施和应用程序的运营团队
站点可靠性工程师（SREs）
IT监控和可观测性团队

14 小时

需要帮助选择合适的课程吗？
china@nobleprog.com 或拨打 400 6116 540

即将举行的公开课程

相关课程

AIOps实战：事件预测与根因自动化

14 小时

使用开源工具构建AIOps管道

14 小时

Enterprise AIOps with Splunk, Moogsoft, and Dynatrace

14 小时

实施 AIOps 与 Prometheus、Grafana 及 ML

14 小时

课程分类

该网站在其他国家/地区

Europe

Österreich (Austria) Schweiz (Switzerland) Deutschland (Germany) Czech Republic Denmark Estonia Finland Greece Magyarország (Hungary) Ireland Luxembourg Latvia España (Spain) Italia (Italy) Lithuania Nederland (Netherlands) Norway Portugal România (Romania) Sverige (Sweden) Türkiye (Turkey) Malta Belgique (Belgium) France Polska (Poland) United Kingdom Bulgaria Moldova Slovakia Slovenia Croatia Serbia

North America

Canada USA Costa Rica Guatemala México (Mexico) Panama

South America

Brasil (Brazil) Argentina Chile Ecuador Colombia Peru Uruguay Venezuela Bolivia

Africa / Middle East

United Arab Emirates Qatar Egypt Saudi Arabia South Africa Morocco Tunisia Kuwait Oman Kenya Nigeria Botswana

Other sites

人力资源培训材料 NobleProg 特许经营 DaDesktop - 云桌面