课程大纲

Apache Iceberg简介

  • Apache Iceberg概述
  • 在现代数据架构中的重要性和使用场景
  • 关键特性和优势

核心概念

  • Iceberg表格式和架构
  • 与其他表格式的比较
  • 分区和模式演进
  • 时间旅行和数据版本控制

设置Apache Iceberg

  • 安装和配置
  • 与各种数据处理引擎的集成
  • 在本地机器上设置Iceberg环境

基本操作

  • 创建和管理Iceberg表
  • 写入和读取Iceberg表
  • 基本CRUD操作

数据迁移与集成

  • 从Hive和其他系统迁移数据到Iceberg
  • 与BI工具的集成
  • 将示例数据集迁移到Iceberg

优化性能

  • 性能调优技术
  • 优化查询和数据扫描
  • Iceberg中的性能优化

高级功能概述

  • 分区演进和隐藏分区
  • 表演进和模式变更
  • 时间旅行和回滚功能
  • 在Iceberg中实现高级功能

总结与下一步

要求

  • 熟悉表、模式、分区和数据摄取等概念
  • SQL的基础知识

受众

  • 数据工程师
  • 数据架构师
  • 数据分析师
  • 软件开发人员
 14 小时

客户评论 (5)

即将举行的公开课程

课程分类