感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
Apache Iceberg简介
- Apache Iceberg概述
- 在现代数据架构中的重要性和使用场景
- 关键特性和优势
核心概念
- Iceberg表格式和架构
- 与其他表格式的比较
- 分区和模式演进
- 时间旅行和数据版本控制
设置Apache Iceberg
- 安装和配置
- 与各种数据处理引擎的集成
- 在本地机器上设置Iceberg环境
基本操作
- 创建和管理Iceberg表
- 写入和读取Iceberg表
- 基本CRUD操作
数据迁移与集成
- 从Hive和其他系统迁移数据到Iceberg
- 与BI工具的集成
- 将示例数据集迁移到Iceberg
优化性能
- 性能调优技术
- 优化查询和数据扫描
- Iceberg中的性能优化
高级功能概述
- 分区演进和隐藏分区
- 表演进和模式变更
- 时间旅行和回滚功能
- 在Iceberg中实现高级功能
总结与下一步
要求
- 熟悉表、模式、分区和数据摄取等概念
- SQL的基础知识
受众
- 数据工程师
- 数据架构师
- 数据分析师
- 软件开发人员
14 小时
客户评论 (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
课程 - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
课程 - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
课程 - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
课程 - Apache Spark in the Cloud
practice tasks