课程大纲

Greenplum架构

  • 并行处理与对称多处理
  • 段角色与集群配置
  • 可扩展性与数据移动
  • Greenplum数据仓库架构

Greenplum表结构

  • 分布式与随机分配表
  • 堆表与仅追加表
  • 行存储与列存储格式
  • 分区表与集群表

数据分布与哈希

  • 哈希逻辑与分布键
  • 偏斜处理与性能影响
  • 哈希映射与行放置策略

索引与性能优化

  • 聚集索引与非聚集索引
  • B树与位图索引用例
  • 索引扫描与存储行为

物理数据库设计

  • 规范化与逻辑模型设计
  • 用户访问策略与分布分析
  • 数据统计与索引决策

反规范化技术

  • 派生数据、汇总表与预连接
  • 列式表作为垂直分区
  • 数据集市与物化视图

高级SQL与查询执行

  • 连接策略与重分布
  • OLAP与窗口函数
  • 临时表、子查询与派生表

EXPLAIN计划与查询调优

  • 阅读与解释EXPLAIN输出
  • 成本分析与计划优化
  • 连接移动与段本地操作

Greenplum工具与最佳实践

  • ANALYZE与VACUUM
  • 使用Nexus进行数据加载与移动
  • 安全性、权限与性能提示

总结与下一步

要求

  • 了解关系型数据库和SQL
  • 有数据仓库或分析系统的经验
  • 熟悉Linux命令行操作

受众

  • 数据架构师和工程师
  • 数据库管理员和技术负责人
  • 使用Greenplum的BI开发人员和分析专家
 21 小时

客户评论 (1)

即将举行的公开课程

课程分类