
本地,有指导的Apache Spark培训课程通过Handson实践演示Spark如何适应大数据生态系统,以及如何使用Spark进行数据分析。 Apache Spark培训可作为“现场实时培训”或“远程实时培训”。现场实地培训可在当地客户现场进行中国或者在NobleProg公司的培训中心中国 。远程实时培训通过交互式远程桌面进行。 NobleProg您当地的培训提供商。
Machine Translated
客户评论
可以应用的场景及案例
zhaopeng liu - Fmr
课程: Spark for Developers
案例分析
国栋 张
课程: Spark for Developers
本届会议的所有部分
Eric Han - Fmr
课程: Spark for Developers
理查德非常冷静和有条不紊,具有分析洞察力 - 正是提出这种课程所需的品质。
Kieran Mac Kenna
课程: Spark for Developers
Machine Translated
我们对整个环境了解得更多。
John Kidd
课程: Spark for Developers
Machine Translated
培训师让课堂变得有趣和有趣,这对全天培训有很大帮助。
Ryan Speelman
课程: Spark for Developers
Machine Translated
我认为培训师具有将幽默和现实生活故事相结合的优秀风格,使手头的主题非常平易近人。我强烈推荐这位教授。
课程: Spark for Developers
Machine Translated
Ernesto在解释使用Spark及其各种模块的高级概念方面做得很好。
Michael Nemerouf
课程: Spark for Developers
Machine Translated
这是我用过的最好的动手编程课程之一。
Laura Kahn
课程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
这是我13年职业生涯中最优秀的在线培训之一。保持伟大的工作!
课程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
当我们想要提出关于不在课程提纲上的事情的半相关问题时,理查德非常愿意离题。解释很清楚,他提出的任何建议都是关于警告的。
ARM Limited
课程: Spark for Developers
Machine Translated
我非常喜欢的虚拟机 老师对这个话题以及其他话题都很了解, 他很好, 也很友好。 我喜欢迪拜的设施。
Safar Alqahtani - Elm Information Security
课程: Big Data Analytics in Health
Machine Translated
练习任务
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
课程: Python and Spark for Big Data (PySpark)
Machine Translated
Ajay非常友好,乐于助人,也对他正在讨论的话题有所了解。
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
课程: Spark for Developers
Machine Translated
实验练习。从随后几天的第一天开始应用该理论。
Dell
课程: A Practical Introduction to Stream Processing
Machine Translated
老师已根据我们当前的需求调整了培训计划。
EduBroker Sp. z o.o.
课程: Python and Spark for Big Data (PySpark)
Machine Translated
以不同的方式进行类似的练习确实有助于理解每个组件( Hadoop / Spark,独立/集群)可以自己以及一起做什么。它为我提供了有关在开发时以及在群集上部署应用程序时应如何在本地计算机上测试应用程序的想法。
Thomas Carcaud - IT Frankfurt GmbH
课程: Spark for Developers
Machine Translated
个人关注。
ARCHANA ANILKUMAR - PPL
课程: Python and Spark for Big Data (PySpark)
Machine Translated
了解火花的罩子下发生了什么,这太棒了。了解引擎盖下发生了什么有助于更好地了解您的代码为什么正在执行或没有执行您期望它执行的。很多培训都是动手的, 这总是伟大的, 关于优化的部分是特别相关的, 我目前的工作, 这是很好的。
Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
我认为培训师具有将幽默和现实生活故事相结合的优秀风格,使手头的主题非常平易近人。我强烈推荐这位教授。
课程: Spark for Developers
Machine Translated
这是我13年职业生涯中最优秀的在线培训之一。保持伟大的工作!
课程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Spark子类别
Apache Spark课程大纲
在这个以讲师为主导的现场培训中,参与者将学习如何使用Alluxio将不同的计算框架与存储系统联系起来,并在他们逐步创建Alluxio应用程序时有效管理多PB级数据。
在培训结束时,参与者将能够:
- 使用Alluxio开发应用程序
- 连接大数据系统和应用程序,同时保留一个名称空间
- 以任何存储格式有效地从大数据中提取价值
- 改善工作负载性能
- 部署和管理Alluxio独立或集群
听众
- 数据科学家
- 开发人员
- 系统管理员
课程形式
- 部分讲座,部分讨论,练习和繁重的实践练习
健康产业拥有大量复杂的异构医学和临床数据。对健康数据应用大数据分析在获得改善医疗保健服务的见解方面具有巨大潜力。然而,这些数据集的巨大性给分析和临床环境的实际应用带来了巨大挑战。
在这个以讲师为主导的现场培训(远程)中,参与者将学习如何在健康状况下进行大数据分析,因为他们将逐步进行一系列动手实践练习。
在培训结束时,参与者将能够:
- 安装和配置大数据分析工具,如Hadoop MapReduce和Spark
- 了解医疗数据的特征
- 应用大数据技术处理医疗数据
- 在健康应用的背景下研究大数据系统和算法
听众
- 开发商
- 数据科学家
课程格式
- 部分讲座,部分讨论,练习和繁重的实践练习。
注意
- 要申请本课程的定制培训,请联系我们安排。
在这一由讲师指导的实时培训中,学员将学习处理图形数据的技术产品和实施方法。目的是识别真实世界里的对象、它们的特征和关系,然后使用图形计算方法对这些关系进行建模并将它们作为数据处理。通过一系列的案例研究、动手练习和实时部署,我们将从广泛的概述开始,然后对特定工具展开详细的学习。
在本次培训结束之后,学员将能够:
- 理解图形数据如何持久化和遍历
- 为给定任务选择最佳框架(从图形数据库到批处理框架)
- 实现Hadoop、Spark、GraphX、Pregel,并行地在多台机器上进行图形计算
- 从图形、流程、遍历方面查看现实世界的大数据问题
受众
- 开发人员
课程形式
- 部分讲座、部分讨论、练习和大量实操
这个由讲师指导的现场培训(现场或远程)介绍了Hortonworks Data Platform (HDP)并引导参与者完成Spark + Hadoop解决方案的部署。
在培训结束时,参与者将能够:
- 使用Hortonworks可以大规模可靠地运行Hadoop 。
- 使用Spark的敏捷分析工作流统一Hadoop的安全性,治理和运营功能。
- 使用Hortonworks调查,验证,认证和支持Spark项目中的每个组件。
- 处理不同类型的数据,包括结构化,非结构化,动态和静止。
课程格式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。
课程自定义选项
- 要申请本课程的定制培训,请联系我们安排。
在这个以讲师为主导的现场培训(现场或远程)中,参与者将学习如何使用现有的大数据存储系统和相关的软件应用程序和微服务来设置和集成不同的Stream Processing框架。
在培训结束时,参与者将能够:
- 安装和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
- 理解并选择最合适的工作框架。
- 数据处理连续,同时,并以逐个记录的方式进行。
- 将Stream Processing解决方案与现有数据库,数据仓库,数据湖等集成。
- 将最合适的流处理库与企业应用程序和微服务集成在一起。
听众
- 开发商
- 软件架构师
课程 格式
- 部分讲座,部分讨论,练习和繁重的实践练习
笔记
- 要申请本课程的定制培训,请联系我们安排。
This instructor-led, live training (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications.
By the end of this training, participants will be able to:
- Install and configure Apache Spark.
- Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
- Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
- Develop machine learning features for a .NET application using Apache Spark capabilities.
- Carry out exploratory analysis using SQL queries on big data sets.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
This instructor-led, live training (online or onsite) is aimed at data scientists who wish to use the SMACK stack to build data processing platforms for big data solutions.
By the end of this training, participants will be able to:
- Implement a data pipeline architecture for processing big data.
- Develop a cluster infrastructure with Apache Mesos and Docker.
- Analyze data with Spark and Scala.
- Manage unstructured data with Apache Cassandra.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
This instructor-led, live training (online or onsite) is aimed at engineers who wish to deploy Apache Spark system for processing very large amounts of data.
By the end of this training, participants will be able to:
- Install and configure Apache Spark.
- Understand the difference between Apache Spark and Hadoop MapReduce and when to use which.
- Quickly read in and analyze very large data sets.
- Integrate Apache Spark with other machine learning tools.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
听众:
数据工程师, DevOps ,数据科学家
本课程将介绍Apache Spark 。学生将学习Spark如何适应Big Data生态系统,以及如何使用Spark进行数据分析。该课程涵盖Spark shell,用于交互式数据分析,Spark内部,Spark API,Spark SQL ,Spark流,机器学习和graphX。
听众:
开发人员/数据分析师
在这一由讲师引导的现场培训中,学员将通过实践练习学习如何使用Python和Spark一起分析大数据。
在本次培训结束后,学员将能够:
- 了解如何使用Spark和Python一起分析大数据
- 开展模拟真实世界环境的练习
- 用不同的工具和技术通过PySpark进行大数据分析
受众
- 开发人员
- IT专业人士
- 数据科学家
课程形式
- 部分讲座、部分讨论、练习和大量实操
这种由讲师指导的实时培训(现场或远程)针对希望通过Spark Streaming和Scala流式传输大数据的软件工程师。
在培训结束时,参与者将能够:
- 使用Scala编程语言创建Spark应用程序。
- 使用Spark Streaming处理连续的数据流。
- 使用Spark Streaming处理实时数据流。
课程形式
- 互动式讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- 要请求此课程的定制培训,请与我们联系安排。
- 执行SQL查询。
- 从现有Hive安装中读取数据。
在这个由讲师指导的实时培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。
在培训结束时,参与者将能够:
- 安装和配置Spark SQL 。
- 使用Spark SQL执行数据分析。
- 以不同格式查询数据集。
- 可视化数据和查询结果。
课程格式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。
课程自定义选项
- 要申请本课程的定制培训,请联系我们安排。
它分为两个包:
-
spark.mllib包含在RDD之上构建的原始API。
-
spark.ml提供了构建在DataFrame之上的更高级API,用于构建ML管道。
听众
本课程面向希望利用Apache Spark内置机器库的工程师和开发人员