
本地,有指导的Apache Spark培训课程通过Handson实践演示Spark如何适应大数据生态系统,以及如何使用Spark进行数据分析。 Apache Spark培训可作为“现场实时培训”或“远程实时培训”。现场实地培训可在当地客户现场进行中国或者在NobleProg公司的培训中心中国 。远程实时培训通过交互式远程桌面进行。 NobleProg您当地的培训提供商。
Machine Translated
客户评论
可以应用的场景及案例
zhaopeng liu - Fmr
课程: Spark for Developers
案例分析
国栋 张
课程: Spark for Developers
本届会议的所有部分
Eric Han - Fmr
课程: Spark for Developers
理查德非常冷静和有条不紊,具有分析洞察力 - 正是提出这种课程所需的品质。
Kieran Mac Kenna
课程: Spark for Developers
Machine Translated
我们对整个环境了解得更多。
John Kidd
课程: Spark for Developers
Machine Translated
培训师让课堂变得有趣和有趣,这对全天培训有很大帮助。
Ryan Speelman
课程: Spark for Developers
Machine Translated
我认为培训师具有将幽默和现实生活故事相结合的优秀风格,使手头的主题非常平易近人。我强烈推荐这位教授。
课程: Spark for Developers
Machine Translated
Ernesto在解释使用Spark及其各种模块的高级概念方面做得很好。
Michael Nemerouf
课程: Spark for Developers
Machine Translated
这是我用过的最好的动手编程课程之一。
Laura Kahn
课程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
这是我13年职业生涯中最优秀的在线培训之一。保持伟大的工作!
课程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
当我们想要提出关于不在课程提纲上的事情的半相关问题时,理查德非常愿意离题。解释很清楚,他提出的任何建议都是关于警告的。
ARM Limited
课程: Spark for Developers
Machine Translated
我非常喜欢的虚拟机 老师对这个话题以及其他话题都很了解, 他很好, 也很友好。 我喜欢迪拜的设施。
Safar Alqahtani - Elm Information Security
课程: Big Data Analytics in Health
Machine Translated
练习任务
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
课程: Python and Spark for Big Data (PySpark)
Machine Translated
Ajay非常友好,乐于助人,也对他正在讨论的话题有所了解。
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
课程: Spark for Developers
Machine Translated
实验练习。从随后几天的第一天开始应用该理论。
Dell
课程: A Practical Introduction to Stream Processing
Machine Translated
老师已根据我们当前的需求调整了培训计划。
EduBroker Sp. z o.o.
课程: Python and Spark for Big Data (PySpark)
Machine Translated
以不同的方式进行类似的练习确实有助于理解每个组件( Hadoop / Spark,独立/集群)可以自己以及一起做什么。它为我提供了有关在开发时以及在群集上部署应用程序时应如何在本地计算机上测试应用程序的想法。
Thomas Carcaud - IT Frankfurt GmbH
课程: Spark for Developers
Machine Translated
个人关注。
ARCHANA ANILKUMAR - PPL
课程: Python and Spark for Big Data (PySpark)
Machine Translated
去学习火花流,databricks和奥斯红移
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
课程: Apache Spark in the Cloud
Machine Translated
内容和知识。
Jobstreet.com Shared Services Sdn. Bhd.
课程: Apache Spark in the Cloud
Machine Translated
这是非常丰富的。 我有很少的经验与火花之前和迄今为止本课程提供了一个很好的介绍标的。
Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
了解火花的罩子下发生了什么,这太棒了。了解引擎盖下发生了什么有助于更好地了解您的代码为什么正在执行或没有执行您期望它执行的。很多培训都是动手的, 这总是伟大的, 关于优化的部分是特别相关的, 我目前的工作, 这是很好的。
Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
这是一个伟大的班级! 我最喜欢的安德拉什介绍了很清楚什么火花是所有有关,在那里它来自,并有什么问题,它是能够解决。 我比其他一些介绍更好,我看到这只是融入如何使用它。 安德拉斯对这个话题有深刻的知识,并解释了事情。
Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
现场例子是给定和显示的基本方面的火花。
Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
1 \。 高层次概念与技术细节之间的平衡。 安德拉斯对他的教学非常有开发。 运动
Steven Wu - Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
手持会议/分配
Poornima Chenthamarakshan - Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
教练根据观众要求稍微调整训练,所以我们有一些光临一些争议主题,我们要求
Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
他的速度,是伟大的。 我喜欢这个事实,他也理解理论,所以我明白为什么我会做他正在问的事情。
Intelligent Medical Objects
课程: Apache Spark in the Cloud
Machine Translated
我认为培训师具有将幽默和现实生活故事相结合的优秀风格,使手头的主题非常平易近人。我强烈推荐这位教授。
课程: Spark for Developers
Machine Translated
这是我13年职业生涯中最优秀的在线培训之一。保持伟大的工作!
课程: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Spark子类别
Apache Spark课程大纲
-
设置必要的环境,以便在 Spark, Hadoop, 和 Python 开始处理大数据。
了解Spark和0的特性、核心组件和建筑。
了解如何集成 Spark, Hadoop, 和 Python 大数据处理。
探索Spark生态系统中的工具(Spark MlLib, Spark Streaming,Kafka,Sqoop,Kafka,和Flume)。
建立协作过滤推荐系统类似于(3)、YouTube、Amazon、Spotify和(2)ogle。
使用 Apache Mahout 来扩展机器学习算法。
-
互动讲座和讨论。
很多练习和练习。
在现场实验室环境中进行手动实施。
-
要申请此课程的定制培训,请联系我们安排。
- Learn how to use Spark with Python to analyze Big Data.
- Work on exercises that mimic real world cases.
- Use different tools and techniques for big data analysis using PySpark.
- 使用Hortonworks可以大规模可靠地运行Hadoop 。
- 使用Spark的敏捷分析工作流统一Hadoop的安全性,治理和运营功能。
- 使用Hortonworks调查,验证,认证和支持Spark项目中的每个组件。
- 处理不同类型的数据,包括结构化,非结构化,动态和静止。
- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。
- 要申请本课程的定制培训,请联系我们安排。
-
有效地查询、分配和将地质空间数据集集合到规模
在商业智能和预测分析应用中实施地空间数据
使用空间背景扩展移动设备、传感器、日志和可携带设备的能力
-
互动讲座和讨论。
很多练习和练习。
在现场实验室环境中进行手动实施。
-
要申请此课程的定制培训,请联系我们安排。
-
开发一个应用程序与 Alluxio
连接大数据系统和应用程序同时保持一个名称空间
有效地从任何存储格式中的大数据中提取值
提高工作负载性能
分配和管理 Alluxio 单独或集成
-
数据科学家
开发者
系统管理员
-
部分讲座,部分讨论,练习和重实习
- 执行SQL查询。
- 从现有Hive安装中读取数据。 在这个由讲师指导的实时培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。 在培训结束时,参与者将能够:
- 安装和配置Spark SQL 。
- 使用Spark SQL执行数据分析。
- 以不同格式查询数据集。
- 可视化数据和查询结果。
- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。
- 要申请本课程的定制培训,请联系我们安排。
- 安装和配置不同的Stream Processing框架,例如Spark Streaming和Kafka Streaming。
- 理解并选择最合适的工作框架。
- 数据处理连续,同时,并以逐个记录的方式进行。
- 将Stream Processing解决方案与现有数据库,数据仓库,数据湖等集成。
- 将最合适的流处理库与企业应用程序和微服务集成在一起。
- 开发商
- 软件架构师
- 部分讲座,部分讨论,练习和繁重的实践练习
- 要申请本课程的定制培训,请联系我们安排。
- 安装和配置大数据分析工具,如Hadoop MapReduce和Spark
- 了解医疗数据的特征
- 应用大数据技术处理医疗数据
- 在健康应用的背景下研究大数据系统和算法
- 开发商
- 数据科学家
- 部分讲座,部分讨论,练习和繁重的实践练习。
- 要申请本课程的定制培训,请联系我们安排。
- 使用Scala编程语言创建Spark应用程序。
- 使用Spark Streaming处理连续的数据流。
- 使用Spark Streaming处理实时数据流。
- 互动式讲座和讨论。
- 很多练习和练习。
- 在现场实验室环境中动手实施。
- 要请求此课程的定制培训,请与我们联系安排。
-
实施大数据处理的数据管道架构。
建立一个集群基础设施与(6)和(1)。
用 Spark 和 Scala 分析数据。
使用 Apache 管理未结构化数据(0)。
-
互动讲座和讨论。
很多练习和练习。
在现场实验室环境中进行手动实施。
-
要申请此课程的定制培训,请联系我们安排。
-
安置和配置(二)
要明白,在《古兰经》和《古兰经》之间有什么区别?
快速阅读 并分析非常大的数据集。
与其他机械学习工具相结合。
-
互动讲座和讨论。
很多练习和练习。
在现场实验室环境中进行手动实施。
-
要申请此课程的定制培训,请联系我们安排。
-
安置和配置 Apache Spark。
了解.NET 如何实施 Spark APIs 以便从.NET 应用程序访问它们。
开发数据处理应用,使用 C# 或 F#,能够处理数据集,其尺寸以 terabytes 和 pedabytes 测量。
为.NET 应用程序开发机器学习功能,使用 Apache Spark 功能。
在大数据集中进行探索分析,使用 SQL 查询。
-
互动讲座和讨论。
很多练习和练习。
在现场实验室环境中进行手动实施。
-
要申请此课程的定制培训,请联系我们安排。
-
安装和配置 Apache Hadoop.
了解生态系统的四个主要组成部分:HDFS、MapReduce、YARN和0 Common。
使用分布式文件系统(HDFS)将一个集群扩展到数百或数千个节点。
设置 HDFS 作为存储发动机在前置 Spark 部署。
设置 Spark 以获取替代存储解决方案,如 Amazon S3 和 NoSQL 数据库系统,如 Redis, Elasticsearch, Couchbase, Aerospike 等。
执行行政任务,如提供,管理,监测和保证一个 Apache Hadoop 集群。
-
互动讲座和讨论。
很多练习和练习。
在现场实验室环境中进行手动实施。
-
要申请此课程的定制培训,请联系我们安排。
- Set up the necessary development environment to start building NLP pipelines with Spark NLP.
- Understand the features, architecture, and benefits of using Spark NLP.
- Use the pre-trained models available in Spark NLP to implement text processing.
- Learn how to build, train, and scale Spark NLP models for production-grade projects.
- Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
- spark.mllib包含在RDD之上构建的原始API。
- spark.ml提供了构建在DataFrame之上的更高级API,用于构建ML管道。
- 理解图形数据如何持久化和遍历
- 为给定任务选择最佳框架(从图形数据库到批处理框架)
- 实现Hadoop、Spark、GraphX、Pregel,并行地在多台机器上进行图形计算
- 从图形、流程、遍历方面查看现实世界的大数据问题
- 开发人员
- 部分讲座、部分讨论、练习和大量实操
Last Updated: