Apache Spark培训课程

Apache Spark培训课程

本地,有指导的Apache Spark培训课程通过Handson实践演示Spark如何适应大数据生态系统,以及如何使用Spark进行数据分析。 Apache Spark培训可作为“现场实时培训”或“远程实时培训”。现场实地培训可在当地客户现场进行中国或者在NobleProg公司的培训中心中国 。远程实时培训通过交互式远程桌面进行。 NobleProg您当地的培训提供商。

客户评论

★★★★★
★★★★★

Apache Spark子类别

Apache Spark课程大纲

代码名字时长概览
sparkdevSpark for Developers21小时目的: 本课程将介绍Apache Spark。学生将学习Spark如何适应大数据生态系统,以及如何使用Spark进行数据分析。本课程涵盖了用于交互式数据分析的Spark shell,Spark内部版本,Spark API,Spark SQL,Spark流媒体以及机器学习和graphX。 观众: 开发人员/数据分析师
spmllibApache Spark MLlib35小时MLlib是Spark的机器学习(ML)库。其目标是使实际的机器学习具有可扩展性和易用性。它由常用的学习算法和实用工具组成,包括分类,回归,聚类,协同过滤,降维,以及较低级别的优化原语和较高级别的管线API。 它分为两个包: sparkmllib包含构建在RDD之上的原始API。 sparkml提供构建ML管道的构建在DataFrame上的高级API。 听众 本课程面向寻求为Apache Spark使用内置机器库的工程师和开发人员
aitechArtificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP21小时
hdpHortonworks Data Platform (HDP) for Administrators21小时Hortonworks Data Platform是一个开源的Apache Hadoop支持平台,为在Apache Hadoop生态系统上开发大数据解决方案提供了稳定的基础。 这个有指导性的实时培训介绍Hortonworks,并通过部署Spark + Hadoop解决方案向参与者介绍。 在培训结束后,参与者将能够: 使用Hortonworks可以大规模可靠地运行Hadoop 使用Spark的敏捷分析工作流程统一Hadoop的安全性,治理和操作功能。 使用Hortonworks来调查,验证,验证和支持Spark项目中的每个组件处理不同类型的数据,包括结构化,非结构化,动态和特定。 听众 Hadoop管理员 课程的格式 部分讲座,部分讨论,练习和沉重的练习
magellanMagellan: Geospatial Analytics on Spark14小时Magellan是一个开源分布式执行引擎,用于处理大数据的地理空间分析。它在Apache Spark之上实现,它扩展了Spark SQL并为地理空间分析提供了关系抽象。 这种有指导意义的实时培训介绍了实施地理空间分析的概念和方法,并通过在Spark上使用Magellan创建预测分析应用程序来引导参与者。 在培训结束后,参与者将能够: 按比例高效地查询,解析和加入地理空间数据集在商业智能和预测分析应用程序中实施地理空间数据使用空间上下文来扩展移动设备,传感器,日志和可穿戴设备的功能 听众 应用开发者 课程的格式 部分讲座,部分讨论,练习和沉重的练习
alluxioAlluxio: Unifying Disparate Storage Systems7小时Alexio是一个开源的虚拟分布式存储系统,它统一了不同的存储系统,使应用程序能够以内存速度与数据进行交互。它被英特尔,百度和阿里巴巴等公司使用。 在这个有指导意义的现场培训中,参与者将学习如何使用Alexio将不同的计算框架与存储系统连接起来,并在他们逐步通过使用Alluxio创建应用程序时高效地管理多字节规模数据。 在培训结束后,参与者将能够: 使用Alluxio开发应用程序连接大数据系统和应用程序,同时保留一个名称空间从任何存储格式的大数据中有效提取价值改善工作量表现部署和管理独立或群集的Alluxio 听众 数据科学家开发人员系统管理员 课程的格式 部分讲座,部分讨论,练习和沉重的练习
graphcomputing图形计算简介28小时大量现实问题可以用图形来描述。例如,Web图形、社交网络图形、火车网络图形、语言图形。这些图形往往太大,处理它们需要一组专门的工具和流程——这些工具和流程可以称为图形计算(也称为图形分析)。

在这一由讲师指导的实时培训中,学员将学习处理图形数据的技术产品和实施方法。目的是识别真实世界里的对象、它们的特征和关系,然后使用图形计算方法对这些关系进行建模并将它们作为数据处理。通过一系列的案例研究、动手练习和实时部署,我们将从广泛的概述开始,然后对特定工具展开详细的学习。

在本次培训结束之后,学员将能够:

- 理解图形数据如何持久化和遍历
- 为给定任务选择最佳框架(从图形数据库到批处理框架)
- 实现Hadoop、Spark、GraphX、Pregel,并行地在多台机器上进行图形计算
- 从图形、流程、遍历方面查看现实世界的大数据问题

受众

- 开发人员

课程形式

- 部分讲座、部分讨论、练习和大量实操
sparkpython用Spark和Python通过PySpark处理大数据21小时Spark是一个用于查询、分析和转换大数据的数据处理引擎。Python是一种高级编程语言,因其清晰的语法和代码可读性而闻名。PySpark允许用户将Spark与Python连接。

在这一由讲师引导的现场培训中,学员将通过实践练习学习如何使用Python和Spark一起分析大数据。

在本次培训结束后,学员将能够:

- 了解如何使用Spark和Python一起分析大数据
- 开展模拟真实世界环境的练习
- 用不同的工具和技术通过PySpark进行大数据分析

受众

- 开发人员
- IT专业人士
- 数据科学家

课程形式

- 部分讲座、部分讨论、练习和大量实操
sparksqlApache Spark SQL7小时Spark SQL是Apache Spark用于处理结构化和非结构化数据的模块。 Spark SQL提供了关于数据结构以及正在执行的计算的信息。该信息可用于执行优化。 Spark SQL的两个常见用途是: 执行SQL查询。 从现有的Hive安装中读取数据。 在这个有指导意义的现场培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。 在培训结束后,参与者将能够: 安装并配置Spark SQL。 使用Spark SQL执行数据分析。 查询不同格式的数据集。 可视化数据和查询结果。 听众 数据分析师数据科学家数据工程师 课程的 格式 部分讲座,部分讨论,练习和沉重的练习 笔记 要请求本课程的定制培训,请联系我们安排。
introtostreamprocessingA Practical Introduction to Stream Processing21小时流处理指的是“运动中的数据”的实时处理,即对数据进行接收时的计算。这些数据是从传感器事件,网站用户活动,金融交易,信用卡刷卡,点击流等数据源中读取的连续数据流。流处理框架能够读取大量传入数据并几乎同时提供有价值的见解。 在这个有指导意义的现场培训(现场或远程)中,参与者将学习如何设置和集成不同的流处理框架与现有的大数据存储系统以及相关的软件应用程序和微服务。 在培训结束后,参与者将能够: 安装和配置不同的流处理框架,例如Spark Streaming和Kafka Streaming 理解并选择最合适的工作框架数据处理不断,同时进行,并以记录方式记录将流处理解决方案与现有数据库,数据仓库,数据湖等集成将最合适的流处理库与企业应用程序和微服务集成在一起 听众 开发商软件架构师 课程的 格式 部分讲座,部分讨论,练习和沉重的练习 笔记 要请求本课程的定制培训,请联系我们安排。
bigdataanahealthBig Data Analytics in Health21小时大数据分析涉及检查大量不同数据集以发现相关性,隐藏模式和其他有用见解的过程。 健康行业拥有大量复杂的异质医疗和临床数据。在健康数据上应用大数据分析为获得改善医疗服务提供见解提供了巨大的潜力。然而,这些数据集的庞大性对临床环境的分析和实际应用提出了很大的挑战。 在这个具有指导意义的现场培训(远程)中,参与者将学习如何在健康阶段执行大数据分析,以便通过一系列实时实况实验练习。 在培训结束后,参与者将能够: 安装和配置Hadoop MapReduce和Spark等大数据分析工具了解医疗数据的特点应用大数据技术来处理医疗数据研究健康应用环境下的大数据系统和算法听众开发商数据科学家课程的格式部分讲座,部分讨论,练习和沉重的练习。 注意要请求本课程的定制培训,请联系我们安排。
sparkcloudApache Spark in the Cloud21小时Apache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.

AUDIENCE:

Data Engineer, DevOps, Data Scientist
Apache Spark,培训,课程,培训课程, 企业Apache Spark培训, 短期Apache Spark培训, Apache Spark课程, Apache Spark周末培训, Apache Spark晚上培训, Apache Spark训练, 学习Apache Spark, Apache Spark老师, 学Apache Spark班, Apache Spark远程教育, 一对一Apache Spark课程, 小组Apache Spark课程, Apache Spark培训师, Apache Spark辅导班, Apache Spark教程, Apache Spark私教, Apache Spark辅导, Apache Spark讲师

促销课程

课程地址日期价格【远程 / 传统课堂】
Apache Tomcat Administration北京 - 创而新大厦星期三, 2018-12-12 09:30¥24129 / ¥28329
Scrum for Managers and Executives北京 - 数码大厦星期五, 2019-02-01 09:30¥8757 / ¥10957

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!