Apache Spark SQL培训

课程编码

sparksql

课程时长

7 小时 通常来说是1天,包括中间休息。

要求

  • Experience with SQL queries
  • Programming experience in any language

Audience

  • Data analysts
  • Data scientists
  • Data engineers

课程概览

Spark SQLApache Spark用于处理结构化和非结构化数据的模块。 Spark SQL提供有关数据结构以及正在执行的计算的信息。此信息可用于执行优化。 Spark SQL两个常见用途是:
- 执行SQL查询。
- 从现有Hive安装中读取数据。

在这个由讲师指导的实时培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。

在培训结束时,参与者将能够:

  • 安装和配置Spark SQL
  • 使用Spark SQL执行数据分析。
  • 以不同格式查询数据集。
  • 可视化数据和查询结果。

课程格式

  • 互动讲座和讨论。
  • 大量的练习和练习。
  • 在实时实验室环境中亲自实施。

课程自定义选项

  • 要申请本课程的定制培训,请联系我们安排。

Machine Translated

课程大纲

Introduction

Overview of Data Access Approaches (Hive, databases, etc.)

Overview of Spark Features and Architecture

Installing and Configuring Spark

Understanding Dataframes in Spark

Defining Tables and Importing Datasets

Querying Data Frames using SQL

Carrying out Aggregations, JOINs and Nested Queries

Uploading and Accessing Data

Querying Different Types of Data

  • JSON, Parquet, etc.

Querying Data Lakes with SQL

Troubleshooting

Summary and Conclusion

客户评论

★★★★★
★★★★★

课程分类

促销课程

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!