Apache Spark培训课程

Apache Spark培训课程

本地,有指导的Apache Spark培训课程通过Handson实践演示Spark如何适应大数据生态系统,以及如何使用Spark进行数据分析。 Apache Spark培训可作为“现场实时培训”或“远程实时培训”。现场实地培训可在当地客户现场进行中国或者在NobleProg公司的培训中心中国 。远程实时培训通过交互式远程桌面进行。 NobleProg您当地的培训提供商。

Machine Translated

客户评论

★★★★★
★★★★★

Apache Spark课程大纲

Title
课程时长
课程概览
Title
课程时长
课程概览
21 hours
课程概览
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 hours
课程概览
Alluxio是一个开源虚拟分布式存储系统,它统一了不同的存储系统,使应用程序能够以内存速度与数据交互。它被英特尔,百度和阿里巴巴等公司使用。

在这个以讲师为主导的现场培训中,参与者将学习如何使用Alluxio将不同的计算框架与存储系统联系起来,并在他们逐步创建Alluxio应用程序时有效管理多PB级数据。

在培训结束时,参与者将能够:

- 使用Alluxio开发应用程序
- 连接大数据系统和应用程序,同时保留一个名称空间
- 以任何存储格式有效地从大数据中提取价值
- 改善工作负载性能
- 部署和管理Alluxio独立或集群

听众

- 数据科学家
- 开发人员
- 系统管理员

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
21 hours
课程概览
大数据分析涉及检查大量不同数据集的过程,以便发现相关性,隐藏模式和其他有用的见解。

健康产业拥有大量复杂的异构医学和临床数据。对健康数据应用大数据分析在获得改善医疗保健服务的见解方面具有巨大潜力。然而,这些数据集的巨大性给分析和临床环境的实际应用带来了巨大挑战。

在这个以讲师为主导的现场培训(远程)中,参与者将学习如何在健康状况下进行大数据分析,因为他们将逐步进行一系列动手实践练习。

在培训结束时,参与者将能够:

- 安装和配置大数据分析工具,如Hadoop MapReduce和Spark
- 了解医疗数据的特征
- 应用大数据技术处理医疗数据
- 在健康应用的背景下研究大数据系统和算法

听众

- 开发商
- 数据科学家

课程格式

- 部分讲座,部分讨论,练习和繁重的实践练习。

注意

- 要申请本课程的定制培训,请联系我们安排。
28 hours
课程概览
大量现实问题可以用图形来描述。例如,Web图形、社交网络图形、火车网络图形、语言图形。这些图形往往太大,处理它们需要一组专门的工具和流程——这些工具和流程可以称为图形计算(也称为图形分析)。

在这一由讲师指导的实时培训中,学员将学习处理图形数据的技术产品和实施方法。目的是识别真实世界里的对象、它们的特征和关系,然后使用图形计算方法对这些关系进行建模并将它们作为数据处理。通过一系列的案例研究、动手练习和实时部署,我们将从广泛的概述开始,然后对特定工具展开详细的学习。

在本次培训结束之后,学员将能够:

- 理解图形数据如何持久化和遍历
- 为给定任务选择最佳框架(从图形数据库到批处理框架)
- 实现Hadoop、Spark、GraphX、Pregel,并行地在多台机器上进行图形计算
- 从图形、流程、遍历方面查看现实世界的大数据问题

受众

- 开发人员

课程形式

- 部分讲座、部分讨论、练习和大量实操
21 hours
课程概览
Hortonworks Data Platform (HDP)是一个开源的Apache Hadoop支持平台,为在Apache Hadoop生态系统上开发大数据解决方案提供了稳定的基础。

这个由讲师指导的现场培训(现场或远程)介绍了Hortonworks Data Platform (HDP)并引导参与者完成Spark + Hadoop解决方案的部署。

在培训结束时,参与者将能够:

- 使用Hortonworks可以大规模可靠地运行Hadoop 。
- 使用Spark的敏捷分析工作流统一Hadoop的安全性,治理和运营功能。
- 使用Hortonworks调查,验证,认证和支持Spark项目中的每个组件。
- 处理不同类型的数据,包括结构化,非结构化,动态和静止。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
21 hours
课程概览
Stream Processing指的是“运动中的数据”的实时处理,即,在接收数据时对数据执行计算。这些数据被读取为来自数据源的连续流,例如传感器事件,网站用户活动,金融交易,信用卡刷卡,点击流等。 Stream Processing框架能够读取大量传入数据并几乎立即提供有价值的见解。

在这个以讲师为主导的现场培训(现场或远程)中,参与者将学习如何使用现有的大数据存储系统和相关的软件应用程序和微服务来设置和集成不同的Stream Processing框架。

在培训结束时,参与者将能够:

- 安装和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
- 理解并选择最合适的工作框架。
- 数据处理连续,同时,并以逐个记录的方式进行。
- 将Stream Processing解决方案与现有数据库,数据仓库,数据湖等集成。
- 将最合适的流处理库与企业应用程序和微服务集成在一起。

听众

- 开发商
- 软件架构师

课程 格式

- 部分讲座,部分讨论,练习和繁重的实践练习

笔记

- 要申请本课程的定制培训,请联系我们安排。
14 hours
课程概览
Magellan是一个开源分布式执行引擎,用于处理大数据的地理空间分析。它在Apache Spark之上实现,它扩展了Spark SQL并为地理空间分析提供了关系抽象。 这种有指导意义的实时培训介绍了实施地理空间分析的概念和方法,并通过在Spark上使用Magellan创建预测分析应用程序来引导参与者。 在培训结束后,参与者将能够: 按比例高效地查询,解析和加入地理空间数据集在商业智能和预测分析应用程序中实施地理空间数据使用空间上下文来扩展移动设备,传感器,日志和可穿戴设备的功能 听众 应用开发者 课程的格式 部分讲座,部分讨论,练习和沉重的练习
21 hours
课程概览
Apache Spark的学习曲线在开始时逐渐增加,需要付出很多努力来获得第一次回归。本课程旨在突破第一个艰难的部分。参加本课程后,参与者将了解Apache Spark的基础知识,他们将明确区分RDD和DataFrame,他们将学习Python和Scala API,他们将理解执行者和任务等。同样遵循最佳实践,本课程重点关注云部署,Databricks和AWS。学生还将了解AWS EMR与AWS最新Spark服务之一AWS Glue之间的差异。

听众:

数据工程师, DevOps ,数据科学家
21 hours
课程概览
目的:

本课程将介绍Apache Spark 。学生将学习Spark如何适应Big Data生态系统,以及如何使用Spark进行数据分析。该课程涵盖Spark shell,用于交互式数据分析,Spark内部,Spark API,Spark SQL ,Spark流,机器学习和graphX。

听众:

开发人员/数据分析师
21 hours
课程概览
Spark是一个用于查询、分析和转换大数据的数据处理引擎。Python是一种高级编程语言,因其清晰的语法和代码可读性而闻名。PySpark允许用户将Spark与Python连接。

在这一由讲师引导的现场培训中,学员将通过实践练习学习如何使用Python和Spark一起分析大数据。

在本次培训结束后,学员将能够:

- 了解如何使用Spark和Python一起分析大数据
- 开展模拟真实世界环境的练习
- 用不同的工具和技术通过PySpark进行大数据分析

受众

- 开发人员
- IT专业人士
- 数据科学家

课程形式

- 部分讲座、部分讨论、练习和大量实操
7 hours
课程概览
Spark SQL是Apache Spark用于处理结构化和非结构化数据的模块。 Spark SQL提供有关数据结构以及正在执行的计算的信息。此信息可用于执行优化。 Spark SQL两个常见用途是:
- 执行SQL查询。
- 从现有Hive安装中读取数据。

在这个由讲师指导的实时培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。

在培训结束时,参与者将能够:

- 安装和配置Spark SQL 。
- 使用Spark SQL执行数据分析。
- 以不同格式查询数据集。
- 可视化数据和查询结果。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
35 hours
课程概览
MLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且简单。它由常见的学习算法和实用程序组成,包括分类,回归,聚类,协同过滤,降维,以及低级优化原语和更高级别的管道API。

它分为两个包:

-

spark.mllib包含在RDD之上构建的原始API。

-

spark.ml提供了构建在DataFrame之上的更高级API,用于构建ML管道。

听众

本课程面向希望利用Apache Spark内置机器库的工程师和开发人员
Apache Spark,培训,课程,培训课程, 企业Spark培训, 短期Spark培训, Spark课程, Apache Spark周末培训, Spark晚上培训, Apache Spark训练, 学习Apache Spark, Spark老师, 学Apache Spark班, Spark远程教育, 一对一Spark课程, 小组Apache Spark课程, Spark培训师, Spark辅导班, Apache Spark教程, Spark私教, Apache Spark辅导, Spark讲师

促销课程

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!