感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
第一部分:HDFS中的数据管理
- 各种数据格式(JSON/Avro/Parquet)
- 压缩方案
- 数据屏蔽
- 实验:分析不同数据格式;启用压缩
第二部分:高级Pig
- 用户自定义函数
- Pig库介绍(ElephantBird/Data-Fu)
- 使用Pig加载复杂结构化数据
- Pig调优
- 实验:高级Pig脚本编写,解析复杂数据类型
第三部分:高级Hive
- 用户自定义函数
- 压缩表
- Hive性能调优
- 实验:创建压缩表,评估表格式和配置
第四部分:高级HBase
- 高级模式建模
- 压缩
- 批量数据导入
- 宽表与高表比较
- HBase与Pig
- HBase与Hive
- HBase性能调优
- 实验:调优HBase;通过Pig和Hive访问HBase数据;使用Phoenix进行数据建模
要求
- 熟悉Java编程语言(大多数编程练习使用Java)
- 熟悉Linux环境(能够使用Linux命令行,使用vi/nano编辑文件)
- 具备Hadoop的基本知识。
实验环境
零安装:无需在学生的机器上安装Hadoop软件!将为学生提供一个可用的Hadoop集群。
学生需要以下内容
21 小时
客户评论 (5)
实际案例
Ahmet Bolat - Accenture Industrial SS
课程 - Python, Spark, and Hadoop for Big Data
机器翻译
在练习过程中,每当我遇到困难时,James都会详细解释每一步。我对NIFI完全陌生,他解释了NIFI的实际用途,甚至包括开源等基础知识。他从初学者级别到开发者级别,涵盖了NIFI的每一个概念。
Firdous Hashim Ali - MOD A BLOCK
课程 - Apache NiFi for Administrators
机器翻译
我一开始就拥有它。
Peter Scales - CACI Ltd
课程 - Apache NiFi for Developers
机器翻译
实践内容充实,Ajay的理论讲解也非常到位
Dominik Mazur - Capgemini Polska Sp. z o.o.
课程 - Hadoop Administration on MapR
机器翻译
我非常喜欢这个虚拟机。 老师对这个主题以及其他相关主题非常了解,他非常友善且友好。 我也很喜欢迪拜的培训设施。
Safar Alqahtani - Elm Information Security
课程 - Big Data Analytics in Health
机器翻译