Apache Drill用于飞速分析多种大数据格式培训

课程编码

apachedrill

课程时长

21 小时 通常来说是3天,包括中间休息。

要求

  • 了解Hadoop、NoSQL和其他数据存储概念
  • 编写SQL查询的经验
  • Linux命令行相关的经验

课程概览

Apache Drill是一种无模式、分布式、内存列式SQL查询引擎,用于Hadoop、NoSQL及其他云和文件存储系统。Apache Drill的强大之处在于它能够使用单个查询连接来自多个数据存储的数据。Apache Drill支持许多NoSQL数据库和文件系统,包括HBase、MongoDB、MapR-DB、HDFS、MapR-FS、Amazon S3、Azure Blob Storage、Google Cloud Storage、Swift、NAS和本地文件。

在这一由讲师引导的现场培训中,学员将学习Apache Drill的基础知识,然后利用SQL的强大功能和便利性在无需编写代码的情况下交互式查询大数据。学员还将学习如何优化分布式SQL执行的Drill查询。

在本次培训结束后,学员将能够:

  • 对Hadoop上的结构化和半结构化数据进行“自助式”探索
  • 使用SQL查询来查询已知以及未知数据
  • 了解Apache Drills如何接收和执行查询
  • 编写SQL查询来分析不同类型的数据,包括Hive中的结构化数据,HBase或MapR-DB表中的半结构化数据,以及Parquet和JSON文件中保存的数据。
  • 使用Apache Drill执行即时模式发现,绕过对复杂ETL和模式操作的需求
  • 将Apache Drill与BI(商业智能)工具(如Tableau、Qlikview、MicroStrategy、Excel)集成在一起

受众

  • 数据分析师
  • 数据科学家
  • SQL程序员

课程形式

  • 部分讲座、部分讨论、练习和大量实操

课程大纲

Apache Drill介绍

Apache Drill与Spark、Hive、Impala相比如何?

Apache Drill特性和架构概述

  • Apache Drill组件

在Apache Drill中执行SQL查询

理解数据类型和格式

使用模式

案例研究和练习:查询年度销售数据

对JSON数据执行查询

在SQL查询中组合数据类型

创建和删除表和视图

使用嵌套数据和窗口函数

使用Apache Drill执行数据分析

案例研究和练习:分析营销活动的结果

在Apache Drill中设计一个查询计划

在Apache Drill中优化查询

集成Apache Drill和MS Excel

使用Apache Drill ODBC / JDBC驱动程序插入到Tableau、MicroStrategy、Qlikview等

案例研究和练习:可视化好案例的数据和力量

了解Apache Drill的分布式安全模型

Apache Drill性能和调试

总结和结论

客户评论

★★★★★
★★★★★

课程分类

相关课程

促销课程

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

该网站在其他国家/地区