课程大纲

数据仓库基础

  • 仓库的目的、组件和架构
  • 数据集市、企业仓库和湖仓模式
  • OLTP与OLAP基础及工作负载分离

维度建模

  • 事实、维度和粒度
  • 星型模式与雪花模式
  • 缓慢变化维度的类型及处理

ETL与ELT流程

  • 从OLTP和API提取数据的策略
  • 转换、数据清洗和一致性
  • 加载模式、编排和依赖管理

数据质量与元数据管理

  • 数据剖析和验证规则
  • 主数据和参考数据的对齐
  • 数据血缘、目录和文档管理

分析与性能

  • 立方体概念、聚合和物化视图
  • 分区、聚类和索引以优化分析
  • 工作负载管理、缓存和查询调优

安全与治理

  • 访问控制、角色和行级安全
  • 合规性考虑和审计
  • 备份、恢复和可靠性实践

现代架构

  • 云数据仓库和弹性扩展
  • 流式数据摄取和近实时分析
  • 成本优化和监控

结业项目:从源数据到星型模式

  • 将业务流程建模为事实和维度
  • 构建端到端的ETL或ELT工作流
  • 发布仪表板并验证指标

总结与下一步

要求

  • 了解关系型数据库和SQL
  • 具备数据分析或报告经验
  • 对云或本地数据平台有基本了解

受众

  • 从数据分析师转向数据仓库的人员
  • BI开发人员和ETL工程师
  • 数据架构师和团队负责人
 35 小时

客户评论 (5)

即将举行的公开课程

课程分类