Apache Spark培训课程

Apache Spark培训课程

在线或现场,讲师指导的现场Apache Spark培训课程通过动手实践演示Spark如何融入大数据生态系统,以及如何使用Spark进行数据分析。

Apache Spark 培训以“在线实时培训”或“现场实时培训”的形式提供。在线实时培训(又名“远程实时培训”)通过交互式远程桌面进行。现场现场培训可以在中国的客户场所或中国的NobleProg企业培训中心进行。

NobleProg -- 您当地的培训机构

Machine Translated

客户评论

★★★★★
★★★★★

Spark Subcategories

Apache Spark Course Outlines

课程名称
课程时长
课程概览
课程名称
课程时长
课程概览
21小时
Python是数据科学和机械学习的可扩展、灵活和广泛使用的编程语言。 Spark 是一款用于查询、分析和转换大数据的数据处理引擎,而 Hadoop 是用于大规模数据存储和处理的软件图书馆框架。 由教练引导,现场培训(在线或在线)旨在开发人员想要使用和整合Spark,(0)和(1)来处理,分析和转型大型和复杂的数据集。 在本研讨会结束后,参与者将能够:
    设置必要的环境,以便在 Spark, Hadoop, 和 Python 开始处理大数据。 了解Spark和0的特性、核心组件和建筑。 了解如何集成 Spark, Hadoop, 和 Python 大数据处理。 探索Spark生态系统中的工具(Spark MlLib, Spark Streaming,Kafka,Sqoop,Kafka,和Flume)。 建立协作过滤推荐系统类似于(3)、YouTube、Amazon、Spotify和(2)ogle。 使用 Apache Mahout 来扩展机器学习算法。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
21小时
In this instructor-led, live training in 中国, participants will learn how to use Python and Spark together to analyze big data as they work on hands-on exercises. By the end of this training, participants will be able to:
  • Learn how to use Spark with Python to analyze Big Data.
  • Work on exercises that mimic real world cases.
  • Use different tools and techniques for big data analysis using PySpark.
21小时
目的: 本课程将介绍Apache Spark 。学生将学习Spark如何适应Big Data生态系统,以及如何使用Spark进行数据分析。该课程涵盖Spark shell,用于交互式数据分析,Spark内部,Spark API,Spark SQL ,Spark流,机器学习和graphX。 听众: 开发人员/数据分析师
21小时
Hortonworks Data Platform (HDP)是一个开源的Apache Hadoop支持平台,为在Apache Hadoop生态系统上开发大数据解决方案提供了稳定的基础。 这个由讲师指导的现场培训(现场或远程)介绍了Hortonworks Data Platform (HDP)并引导参与者完成Spark + Hadoop解决方案的部署。 在培训结束时,参与者将能够:
  • 使用Hortonworks可以大规模可靠地运行Hadoop 。
  • 使用Spark的敏捷分析工作流统一Hadoop的安全性,治理和运营功能。
  • 使用Hortonworks调查,验证,认证和支持Spark项目中的每个组件。
  • 处理不同类型的数据,包括结构化,非结构化,动态和静止。
课程格式
  • 互动讲座和讨论。
  • 大量的练习和练习。
  • 在实时实验室环境中亲自实施。
课程自定义选项
  • 要申请本课程的定制培训,请联系我们安排。
14小时
Magellan 是一款开源分布式执行引擎,用于大数据的地质空间分析。 实施在 Apache Spark 的顶部,它扩展 Spark SQL 并为地空间分析提供相对抽象。 由导师领导的现场培训介绍了实施地空间分析的概念和方法,并通过创建一个预测分析应用程序,使用Magellan在Spark的参与者行走。 在本研讨会结束后,参与者将能够:
    有效地查询、分配和将地质空间数据集集合到规模 在商业智能和预测分析应用中实施地空间数据 使用空间背景扩展移动设备、传感器、日志和可携带设备的能力
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
7小时
Alluxio 是一个开源的虚拟分布式存储系统,结合了不同存储系统,并允许应用程序以内存速度与数据进行互动。 它由Intel、Baidu 和 Alibaba 等公司使用。 在本导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导 在本研讨会结束后,参与者将能够:
    开发一个应用程序与 Alluxio 连接大数据系统和应用程序同时保持一个名称空间 有效地从任何存储格式中的大数据中提取值 提高工作负载性能 分配和管理 Alluxio 单独或集成
观众
    数据科学家 开发者 系统管理员
课程格式
    部分讲座,部分讨论,练习和重实习
7小时
Spark SQL是Apache Spark用于处理结构化和非结构化数据的模块。 Spark SQL提供有关数据结构以及正在执行的计算的信息。此信息可用于执行优化。 Spark SQL两个常见用途是:
- 执行SQL查询。
- 从现有Hive安装中读取数据。 在这个由讲师指导的实时培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。 在培训结束时,参与者将能够:
  • 安装和配置Spark SQL 。
  • 使用Spark SQL执行数据分析。
  • 以不同格式查询数据集。
  • 可视化数据和查询结果。
课程格式
  • 互动讲座和讨论。
  • 大量的练习和练习。
  • 在实时实验室环境中亲自实施。
课程自定义选项
  • 要申请本课程的定制培训,请联系我们安排。
21小时
Stream Processing指的是“运动中的数据”的实时处理,即,在接收数据时对数据执行计算。这些数据被读取为来自数据源的连续流,例如传感器事件,网站用户活动,金融交易,信用卡刷卡,点击流等。 Stream Processing框架能够读取大量传入数据并几乎立即提供有价值的见解。 在这个以讲师为主导的现场培训(现场或远程)中,参与者将学习如何使用现有的大数据存储系统和相关的软件应用程序和微服务来设置和集成不同的Stream Processing框架。 在培训结束时,参与者将能够:
  • 安装和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
  • 理解并选择最合适的工作框架。
  • 数据处理连续,同时,并以逐个记录的方式进行。
  • 将Stream Processing解决方案与现有数据库,数据仓库,数据湖等集成。
  • 将最合适的流处理库与企业应用程序和微服务集成在一起。
听众
  • 开发商
  • 软件架构师
课程 格式
  • 部分讲座,部分讨论,练习和繁重的实践练习
笔记
  • 要申请本课程的定制培训,请联系我们安排。
21小时
大数据分析涉及检查大量不同数据集的过程,以便发现相关性,隐藏模式和其他有用的见解。 健康产业拥有大量复杂的异构医学和临床数据。对健康数据应用大数据分析在获得改善医疗保健服务的见解方面具有巨大潜力。然而,这些数据集的巨大性给分析和临床环境的实际应用带来了巨大挑战。 在这个以讲师为主导的现场培训(远程)中,参与者将学习如何在健康状况下进行大数据分析,因为他们将逐步进行一系列动手实践练习。 在培训结束时,参与者将能够:
  • 安装和配置大数据分析工具,如Hadoop MapReduce和Spark
  • 了解医疗数据的特征
  • 应用大数据技术处理医疗数据
  • 在健康应用的背景下研究大数据系统和算法
听众
  • 开发商
  • 数据科学家
课程格式
  • 部分讲座,部分讨论,练习和繁重的实践练习。
注意
  • 要申请本课程的定制培训,请联系我们安排。
21小时
Apache Spark的学习曲线在开始时逐渐增加,需要付出很多努力来获得第一次回归。本课程旨在突破第一个艰难的部分。参加本课程后,参与者将了解Apache Spark的基础知识,他们将明确区分RDD和DataFrame,他们将学习Python和Scala API,他们将理解执行者和任务等。同样遵循最佳实践,本课程重点关注云部署,Databricks和AWS。学生还将了解AWS EMR与AWS最新Spark服务之一AWS Glue之间的差异。 听众: 数据工程师, DevOps ,数据科学家
21小时
Scala是Java的简化版本,用于大规模功能和面向对象的编程。 Apache Spark Streaming是Spark API的扩展组件,用于将大数据集作为实时流处理。 Spark Streaming和Scala一起使大数据流化。 这种由讲师指导的实时培训(现场或远程)针对希望通过Spark Streaming和Scala流式传输大数据的软件工程师。 在培训结束时,参与者将能够:
  • 使用Scala编程语言创建Spark应用程序。
  • 使用Spark Streaming处理连续的数据流。
  • 使用Spark Streaming处理实时数据流。
课程形式
  • 互动式讲座和讨论。
  • 很多练习和练习。
  • 在现场实验室环境中动手实施。
课程自定义选项
  • 要请求此课程的定制培训,请与我们联系安排。
14小时
SMACK 是数据平台软件的集合,即 Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, 和 Apache Kafka。 使用 SMACK 插槽,用户可以创建和规模数据处理平台。 这项由导师领导的直播培训(在线或在线)是针对数据科学家,他们希望使用SMACK stack来构建大数据解决方案的数据处理平台。 在本研讨会结束后,参与者将能够:
    实施大数据处理的数据管道架构。 建立一个集群基础设施与(6)和(1)。 用 Spark 和 Scala 分析数据。 使用 Apache 管理未结构化数据(0)。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
21小时
Apache Spark 是一款分析引擎,旨在将数据分布在一个集群中,以便同时处理。 它包含流媒体, SQL,机器学习和图形处理的模块。 由教练领导的现场培训(在线或在线)是针对那些希望部署系统处理大量数据的工程师。 在本研讨会结束后,参与者将能够:
    安置和配置(二) 要明白,在《古兰经》和《古兰经》之间有什么区别? 快速阅读 并分析非常大的数据集。 与其他机械学习工具相结合。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
21小时
Apache Spark是一种分布式处理引擎,用于分析非常大的数据集。 它可以在实时和集合中处理数据,以及进行机器学习、广告查询和图形处理。 .NET for Apache Spark 是一个免费、开源和跨平台的大数据分析框架,支持以 C# 或 F# 编写的应用程序。 由教练领导的现场培训(在线或在线)针对那些希望在他们的.NET 应用中进行大数据分析的开发人员。 在本研讨会结束后,参与者将能够:
    安置和配置 Apache Spark。 了解.NET 如何实施 Spark APIs 以便从.NET 应用程序访问它们。 开发数据处理应用,使用 C# 或 F#,能够处理数据集,其尺寸以 terabytes 和 pedabytes 测量。 为.NET 应用程序开发机器学习功能,使用 Apache Spark 功能。 在大数据集中进行探索分析,使用 SQL 查询。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
35小时
Apache Hadoop 是一个流行的数据处理框架,用于在许多计算机上处理大数据集。 由教练领导,现场培训(在线或在线)旨在系统管理员谁想要学习如何在他们的组织内设置,部署和管理 Hadoop 集群。 在本研讨会结束后,参与者将能够:
    安装和配置 Apache Hadoop. 了解生态系统的四个主要组成部分:HDFS、MapReduce、YARN和0 Common。 使用分布式文件系统(HDFS)将一个集群扩展到数百或数千个节点。   设置 HDFS 作为存储发动机在前置 Spark 部署。 设置 Spark 以获取替代存储解决方案,如 Amazon S3 和 NoSQL 数据库系统,如 Redis, Elasticsearch, Couchbase, Aerospike 等。 执行行政任务,如提供,管理,监测和保证一个 Apache Hadoop 集群。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
14小时
This instructor-led, live training in 中国 (online or onsite) is aimed at data scientists and developers who wish to use Spark NLP, built on top of Apache Spark, to develop, implement, and scale natural language text processing models and pipelines. By the end of this training, participants will be able to:
  • Set up the necessary development environment to start building NLP pipelines with Spark NLP.
  • Understand the features, architecture, and benefits of using Spark NLP.
  • Use the pre-trained models available in Spark NLP to implement text processing.
  • Learn how to build, train, and scale Spark NLP models for production-grade projects.
  • Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
35小时
MLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且简单。它由常见的学习算法和实用程序组成,包括分类,回归,聚类,协同过滤,降维,以及低级优化原语和更高级别的管道API。 它分为两个包:
  • spark.mllib包含在RDD之上构建的原始API。
  • spark.ml提供了构建在DataFrame之上的更高级API,用于构建ML管道。
听众 本课程面向希望利用Apache Spark内置机器库的工程师和开发人员
21小时
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
28小时
大量现实问题可以用图形来描述。例如,Web图形、社交网络图形、火车网络图形、语言图形。这些图形往往太大,处理它们需要一组专门的工具和流程——这些工具和流程可以称为图形计算(也称为图形分析)。 在这一由讲师指导的实时培训中,学员将学习处理图形数据的技术产品和实施方法。目的是识别真实世界里的对象、它们的特征和关系,然后使用图形计算方法对这些关系进行建模并将它们作为数据处理。通过一系列的案例研究、动手练习和实时部署,我们将从广泛的概述开始,然后对特定工具展开详细的学习。 在本次培训结束之后,学员将能够:
  • 理解图形数据如何持久化和遍历
  • 为给定任务选择最佳框架(从图形数据库到批处理框架)
  • 实现Hadoop、Spark、GraphX、Pregel,并行地在多台机器上进行图形计算
  • 从图形、流程、遍历方面查看现实世界的大数据问题
受众
  • 开发人员
课程形式
  • 部分讲座、部分讨论、练习和大量实操

Last Updated:

Apache Spark,培训,课程,培训课程, 企业Spark培训, 短期Spark培训, Spark课程, Apache Spark周末培训, Spark晚上培训, Apache Spark训练, 学习Apache Spark, Spark老师, 学Apache Spark班, Spark远程教育, 一对一Spark课程, 小组Apache Spark课程, Spark培训师, Spark辅导班, Apache Spark教程, Spark私教, Apache Spark辅导, Spark讲师

促销课程

目前没有课程折扣

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

该网站在其他国家/地区