感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
数据仓库基础
- 仓库的目的、组件和架构
- 数据集市、企业仓库和湖仓模式
- OLTP与OLAP基础及工作负载分离
维度建模
- 事实、维度和粒度
- 星型模式与雪花模式
- 缓慢变化维度的类型及处理
ETL与ELT流程
- 从OLTP和API提取数据的策略
- 转换、数据清洗和一致性
- 加载模式、编排和依赖管理
数据质量与元数据管理
- 数据剖析和验证规则
- 主数据和参考数据的对齐
- 数据血缘、目录和文档管理
分析与性能
- 立方体概念、聚合和物化视图
- 分区、聚类和索引以优化分析
- 工作负载管理、缓存和查询调优
安全与治理
- 访问控制、角色和行级安全
- 合规性考虑和审计
- 备份、恢复和可靠性实践
现代架构
- 云数据仓库和弹性扩展
- 流式数据摄取和近实时分析
- 成本优化和监控
结业项目:从源数据到星型模式
- 将业务流程建模为事实和维度
- 构建端到端的ETL或ELT工作流
- 发布仪表板并验证指标
总结与下一步
要求
- 了解关系型数据库和SQL
- 具备数据分析或报告经验
- 对云或本地数据平台有基本了解
受众
- 从数据分析师转向数据仓库的人员
- BI开发人员和ETL工程师
- 数据架构师和团队负责人
35 小时
客户评论 (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
课程 - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
课程 - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
课程 - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
课程 - Apache Spark in the Cloud
practice tasks