高级Apache Iceberg 培训

(2 客户评论)

Apache Iceberg 是一种用于大规模数据集的开源表格格式，它将 SQL 表的可靠性和简单性引入大数据领域。它旨在解决在数据湖中管理大数据所面临的挑战，这些挑战通常涉及处理复杂模式、大文件和多样化数据源。

本次由讲师指导的培训（线上或线下）面向高级数据专业人员，旨在帮助他们优化数据处理工作流程，确保数据完整性，并实施能够应对现代大数据应用复杂性的稳健数据湖仓解决方案。

培训结束后，参与者将能够：

深入了解 Iceberg 的架构，包括元数据管理和文件布局。
在不同环境中配置 Iceberg 以实现最佳性能，并将其与多种数据处理引擎集成。
管理大规模 Iceberg 表，执行复杂模式更改，并处理分区演变。
掌握优化查询性能和数据扫描效率的技术，以应对大规模数据集。
实施机制以确保数据一致性，管理事务性保证，并处理分布式环境中的故障。

课程形式

互动式讲座和讨论。
大量练习和实践。
在实时实验室环境中进行动手操作。

课程定制选项

如需为此课程定制培训，请联系我们安排。

感谢您发送咨询！我们的团队成员将很快与您联系。

感谢您发送预订！我们的团队成员将很快与您联系。

课程大纲

Apache Iceberg 简介

Apache Iceberg 概述
基本概念回顾

深入探讨 Iceberg 架构

深入分析 Iceberg 的表格式
详细架构概述，包括元数据和文件布局
模式和分区演化的内部机制

高级安装与配置

在不同环境中配置 Iceberg 以实现最佳性能
与各种数据处理引擎集成
高级设置：安全性、加密和访问控制
在分布式环境中设置 Iceberg

高级操作与维护

管理大规模 Iceberg 表
实施和管理复杂的模式变更
处理分区演化和隐藏分区
结合模式和分区变化的高级 CRUD 操作

查询优化技术

减少查询延迟的技术
分区剪枝和文件剪枝
元数据缓存和优化策略
实施和测试查询优化技术

大规模数据集的性能调优

优化大规模数据集的性能
使用 Iceberg 内置功能进行性能调优
真实场景中的性能调优案例研究
大规模数据集的性能调优

高级数据迁移与集成

从其他系统迁移复杂数据结构
将 Iceberg 与实时数据流集成
迁移复杂数据集并集成实时数据流

可靠性与一致性

在分布式环境中确保数据一致性和完整性
实施和管理事务保证
处理故障和恢复机制
实施可靠性和一致性功能

高级功能与定制

自定义目录实现
使用自定义功能扩展 Iceberg
实现自定义目录并扩展 Iceberg 功能

数据治理与合规性

实施数据治理策略
遵守数据法规
管理审计跟踪和数据血缘
实施治理和合规性功能

总结与下一步

要求

熟悉核心概念、基本操作以及Iceberg表管理

受众

数据工程师
数据架构师
数据分析师
软件开发人员

21 小时

需要帮助选择合适的课程吗？
china@nobleprog.com 或拨打 400 6116 540

客户评论 (2)

Spark世界的探索之旅：这是一门非常密集的课程。DSL、Spark SQL、分区与分桶对我来说是重点内容。

Georgiana Elisabeta

课程 - Apache Spark Fundamentals

机器翻译

实践练习。课程本应为5天，但3天的学习帮助我解决了在使用NiFi时遇到的许多问题。

高级Apache Iceberg 培训

课程大纲

要求

客户评论 (2)

Georgiana Elisabeta

课程 - Apache Spark Fundamentals

James - BHG Financial

课程 - Apache NiFi for Administrators

即将举行的公开课程

高级Apache Iceberg

高级Apache Iceberg

高级Apache Iceberg

高级Apache Iceberg

课程分类

该网站在其他国家/地区

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

高级Apache Iceberg 培训

课程大纲

要求

客户评论 (2)

Georgiana Elisabeta

课程 - Apache Spark Fundamentals

James - BHG Financial

课程 - Apache NiFi for Administrators

即将举行的公开课程

高级Apache Iceberg

高级Apache Iceberg

高级Apache Iceberg

高级Apache Iceberg

相关课程

Apache Iceberg 基础

使用Google Colab和Apache Spark进行大数据分析

面向政府机构的大数据商业智能

Data Analysis和Big Data的实用介绍 - 3天

Big Data 和高级分析

大数据商业智能用于刑事情报分析

Apache NiFi 管理员培训

PySpark与机器学习

Apache Spark基础

Apache Spark 管理

Apache Spark 云端应用

用Spark和Python通过PySpark处理大数据

Python、Spark和Hadoop在大数据中的应用

Stratio: 使用PySpark的Rocket与Intelligence模块

课程分类

大数据

该网站在其他国家/地区

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites