课程大纲

Apache Iceberg 简介

  • Apache Iceberg 概述
  • 现代数据架构中的重要性和用例
  • 主要特性和优势

核心概念

  • 冰山表格式和体系结构
  • 与其他表格格式的比较
  • 分区和架构演变
  • 时间旅行和数据版本控制

设置 Apache Iceberg

  • 安装和配置
  • 将 Iceberg 与各种数据处理引擎集成
  • 在本地计算机上设置 Iceberg 环境

基本操作

  • 创建和管理 Iceberg 表
  • 写入和读取 Iceberg 表
  • 基本 CRUD 操作

数据迁移和集成

  • 将数据从 Hive 和其他系统迁移到 Iceberg
  • 与 BI 工具集成
  • 将示例数据集迁移到 Iceberg

优化性能

  • 性能调优技术
  • 优化查询和数据扫描
  • Iceberg 中的性能优化

高级功能概述

  • 分区演进和隐藏分区
  • 表演变和架构更改
  • 时间旅行和回滚功能
  • 在 Iceberg 中实现高级功能

摘要和后续步骤

要求

  • 熟悉表、架构、分区和数据引入等概念
  • 基础知识 SQL

观众

  • 数据工程师
  • 数据架构师
  • 数据分析师
  • 软件开发人员
 14 小时

客户评论 (3)

即将举行的公开课程

课程分类