Hadoop培训课程

Hadoop培训课程

本地,讲师指导的实时Apache Hadoop培训课程通过交互式实践练习演示Hadoop生态系统的核心组件以及如何使用这些技术解决大规模问题。 Hadoop培训可作为“现场实时培训”或“远程实时培训”。现场培训可以在当地的客户场所进行中国或者在NobleProg的企业培训中心中国 。远程实时培训通过交互式远程桌面进行。 NobleProg - 您当地的培训机构

Machine Translated

客户评论

★★★★★
★★★★★

Hadoop课程大纲

Title
Duration
Overview
Title
Duration
Overview
7 hours
Overview
Alluxio是一个开源虚拟分布式存储系统,它统一了不同的存储系统,使应用程序能够以内存速度与数据交互。它被英特尔,百度和阿里巴巴等公司使用。

在这个以讲师为主导的现场培训中,参与者将学习如何使用Alluxio将不同的计算框架与存储系统联系起来,并在他们逐步创建Alluxio应用程序时有效管理多PB级数据。

在培训结束时,参与者将能够:

- 使用Alluxio开发应用程序
- 连接大数据系统和应用程序,同时保留一个名称空间
- 以任何存储格式有效地从大数据中提取价值
- 改善工作负载性能
- 部署和管理Alluxio独立或集群

听众

- 数据科学家
- 开发人员
- 系统管理员

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
28 hours
Overview
听众:

本课程旨在揭开大数据/ hadoop技术的神秘面纱,并表明它不难理解。
14 hours
Overview
Sqoop是一个开源软件工具,用于在Hadoop和关系数据库或大型机之间传输数据。它可用于将数据从关系数据库管理系统(RDBMS)(如My SQL或Oracle或大型机)导入Hadoop分布式文件系统(HDFS)。此后,可以在Hadoop MapReduce中转换数据,然后将其重新导出回RDBMS。

在这个由讲师指导的实时培训中,参与者将学习如何使用Sqoop将数据从传统的关系数据库导入Hadoop存储,如HDFS或Hive ,反之亦然。

在培训结束时,参与者将能够:

- 安装并配置Sqoop
- 将数据从My SQL导入HDFS和Hive
- 将数据从HDFS和Hive导入My SQL

听众

- 系统管理员
- 数据工程师

课程 格式

- 部分讲座,部分讨论,练习和繁重的实践练习

注意

- 要申请本课程的定制培训,请联系我们安排。
14 hours
Overview
Apache Samza是一个用于流处理的开源近实时异步计算框架。它使用Apache Kafka进行消息传递,使用Apache Kafka Hadoop YARN进行容错,处理器隔离,安全性和资源管理。

这个由讲师指导的实时培训介绍了消息传递系统和分布式流处理背后的原理,同时通过创建基于Samza的示例项目和作业执行来引导参与者。

在培训结束时,参与者将能够:

- 使用Samza简化生成和使用消息所需的代码。
- 解耦来自应用程序的消息处理。
- 使用Samza实现近实时异步计算。
- 使用流处理为消息传递系统提供更高级别的抽象。

听众

- 开发商

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
7 hours
Overview
Apache NiFi (Hortonworks DataFlow)是一个实时集成的数据物流和简单的事件处理平台,可以在系统之间移动,跟踪和自动化数据。它使用基于流的编程编写,并提供基于Web的用户界面,以实时管理数据流。

在这个以讲师为主导的现场培训中,参与者将学习基于流程的编程的基础知识,因为他们使用Apache NiFi开发了许多演示扩展,组件和处理器。

在培训结束时,参与者将能够:

- 了解NiFi的架构和数据流概念。
- 使用NiFi和第三方API开发扩展。
- 定制开发自己的Apache Nifi处理器。
- 从不同的和不常见的文件格式和数据源中提取和处理实时数据。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
21 hours
Overview
Apache NiFi (Hortonworks DataFlow)是一个实时集成的数据物流和简单的事件处理平台,可以在系统之间移动,跟踪和自动化数据。它使用基于流的编程编写,并提供基于Web的用户界面,以实时管理数据流。

在这个由讲师指导的现场培训(现场或远程)中,参与者将学习如何在实验室环境中部署和管理Apache NiFi 。

在培训结束时,参与者将能够:

- 安装和配置Apachi NiFi。
- 从不同的分布式数据源(包括数据库和大数据湖)获取,转换和管理数据。
- 自动化数据流。
- 启用流式分析。
- 应用各种方法进行数据摄取。
- 将Big Data转化为业务洞察力。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
14 hours
Overview
受众

- 开发人员
课程 的

格式

- 讲座, 动手实践, 小测试的过程中, 以衡量理解
21 hours
Overview
Cloudera Impala是Apache Hadoop集群的开源大规模并行处理(MPP) SQL查询引擎。

Impala使用户能够向存储在Hadoop分布式文件系统和Apache Hbase中的数据发出低延迟SQL查询,而无需数据移动或转换。

听众

本课程面向分析师和数据科学家,通过Business Intelligence或SQL工具对存储在Hadoop数据进行分析。

在此课程结束后,代表们将能够

- 使用Impala从Hadoop集群中提取有意义的信息。
- 编写特定程序以便在Impala SQL Dialect中实现Business Intelligence 。
- 对Impala故障排除。
7 hours
Overview
本课程介绍如何从Hive提取数据的人员使用Hive SQL语言(AKA: Hive HQL, Hive SQL , Hive QL)
21 hours
Overview
Hortonworks Data Platform (HDP)是一个开源的Apache Hadoop支持平台,为在Apache Hadoop生态系统上开发大数据解决方案提供了稳定的基础。

这个由讲师指导的现场培训(现场或远程)介绍了Hortonworks Data Platform (HDP)并引导参与者完成Spark + Hadoop解决方案的部署。

在培训结束时,参与者将能够:

- 使用Hortonworks可以大规模可靠地运行Hadoop 。
- 使用Spark的敏捷分析工作流统一Hadoop的安全性,治理和运营功能。
- 使用Hortonworks调查,验证,认证和支持Spark项目中的每个组件。
- 处理不同类型的数据,包括结构化,非结构化,动态和静止。

课程格式

- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。

课程自定义选项

- 要申请本课程的定制培训,请联系我们安排。
21 hours
Overview
本课程介绍HBase - 一个基于Hadoop的无SQL存储。本课程面向将使用HBase开发应用程序的开发人员以及将管理HBase集群的管理员。

我们将通过HBase的HBase架构和数据建模以及应用程序开发向开发人员展示。它还将讨论将MapReduce与HBase一起使用,以及与性能优化相关的一些管理主题。该课程非常实用,包含大量实验练习。

持续时间 :3天

受众 :开发人员和管理员
28 hours
Overview
Hadoop是一种流行的Big Data处理框架。 Python是一种高级编程语言,以其清晰的语法和代码可读性而闻名。

在这个以讲师为主导的现场培训中,参与者将学习如何使用Python来处理Hadoop ,MapReduce,Pig和Spark,因为他们会逐步完成多个示例和用例。

在培训结束时,参与者将能够:

- 了解Hadoop ,MapReduce,Pig和Spark背后的基本概念
- 将Python与Hadoop分布式文件系统(HDFS),MapReduce,Pig和Spark结合使用
- 使用Snakebite以编程方式访问Python HDFS
- 使用mrjob在Python编写MapReduce作业
- 用Python编写Spark程序
- 使用Python UDF扩展pig的功能
- 使用Luigi管理MapReduce作业和Pig脚本

听众

- 开发商
- IT专业人士

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
14 hours
Overview
随着越来越多的软件和IT项目从本地处理和数据管理转向分布式处理和大数据存储,项目经理们正在意识到需要升级他们的知识和技能,以掌握与大数据项目和机会相关的概念和实践。

本课程将向项目经理介绍当下最流行的大数据处理框架:Hadoop。

在这一由讲师引导的培训中,学员将学习Hadoop生态系统的核心组件,以及这些技术如何用于解决大规模问题。在学习这些基础的过程中,学员还将提高他们与这些系统的开发人员和实施人员以及许多IT项目涉及的数据科学家和分析师沟通的能力。

受众

- 希望将Hadoop应用到其现有开发或IT基础架构中的项目经理
- 需要与包括大数据工程师、数据科学家和业务分析师在内的跨职能团队进行沟通的项目经理

课程形式

- 部分讲座、部分讨论、练习和大量实操
21 hours
Overview
Apache Ambari是一个开源管理平台,用于配置,管理,监控和保护Apache Hadoop集群。

在这个由讲师指导的实时培训中,参与者将学习Ambari提供的管理工具和实践,以成功管理Hadoop集群。

在培训结束时,参与者将能够:

- 使用Ambari设置实时Big Data集群
- 将Ambari的高级功能和功能应用于各种用例
- 根据需要无缝添加和删除节点
- 通过调整和调整来改善Hadoop集群的性能

听众

- DevOps
- 系统管理员
- 数据库管理员
- Hadoop测试专业人士

课程形式

- 部分讲座,部分讨论,练习和繁重的实践练习
21 hours
Overview
Hadoop是最受欢迎的Big Data处理框架。
21 hours
Overview
Apache Hadoop是用于处理服务器群集上的Big Data的最流行的框架之一。本课程深入研究HDFS,高级Pig, Hive和HBase中的数据管理。这些高级编程技术将有益于经验丰富的Hadoop开发人员。

观众 :开发者

持续时间:三天

格式:讲座(50%)和动手实验室(50%)。
28 hours
Overview
Apache Hadoop是用于处理服务器群集上的Big Data的最流行的框架。本课程将向开发人员介绍各种组件(HDFS,MapReduce,Pig, Hive和HBase)的Hadoop生态系统。
21 hours
Overview
Apache Hadoop是处理大数据最流行的框架。 Hadoop提供丰富而深入的分析功能,并且正在进入传统BI分析世界。本课程将向分析师介绍Hadoop生态系统的核心组件及其分析听众业务分析师持续时间三天格式讲座和实验室之手。
21 hours
Overview
Apache Hadoop是用于处理服务器群集上的Big Data的最流行的框架。在这三天(可选择四天)课程中,与会者将了解Hadoop及其生态系统的业务优势和用例,如何规划群集部署和增长,如何安装,维护,监控,排除故障和优化Hadoop 。他们还将练习集群批量数据加载,熟悉各种Hadoop发行版,并练习安装和管理Hadoop生态系统工具。本课程结束时讨论了使用Kerberos保护集群。

“......材料准备得很充分,并且要彻底覆盖。该实验室非常有帮助,组织良好“
- Andrew Nguyen,微软在线Advertising首席集成DW工程师

听众

Hadoop管理员

格式

讲座和动手实验,大约平衡60%的讲座,40%的实验室。
21 hours
Overview
本课程专门面向寻求在分布式系统环境中存储和处理大型数据集的解决方案的IT专家

课程目标:

获取有关Hadoop集群管理的知识
14 hours
Overview
Datameer是基于Hadoop构建的商业智能和分析平台。它允许最终用户以易用的方式访问,探索和关联大规模,结构化,半结构化和非结构化数据。 在这个有指导意义的实时培训中,参与者将学习如何使用Datameer来克服Hadoop陡峭的学习曲线,因为他们将逐步完成对一系列大数据源的设置和分析。 在培训结束后,参与者将能够: 创建,策划和交互式地探索企业数据湖访问商业智能数据仓库,交易数据库和其他分析商店使用电子表格用户界面设计端对端数据处理管道访问预建功能来探索复杂的数据关系使用拖放式向导来可视化数据并创建仪表板使用表格,图表,图形和地图来分析查询结果 听众 数据分析师 课程的格式 部分讲座,部分讨论,练习和沉重的练习
21 hours
Overview
大数据分析涉及检查大量不同数据集的过程,以便发现相关性,隐藏模式和其他有用的见解。

健康产业拥有大量复杂的异构医学和临床数据。对健康数据应用大数据分析在获得改善医疗保健服务的见解方面具有巨大潜力。然而,这些数据集的巨大性给分析和临床环境的实际应用带来了巨大挑战。

在这个以讲师为主导的现场培训(远程)中,参与者将学习如何在健康状况下进行大数据分析,因为他们将逐步进行一系列动手实践练习。

在培训结束时,参与者将能够:

- 安装和配置大数据分析工具,如Hadoop MapReduce和Spark
- 了解医疗数据的特征
- 应用大数据技术处理医疗数据
- 在健康应用的背景下研究大数据系统和算法

听众

- 开发商
- 数据科学家

课程格式

- 部分讲座,部分讨论,练习和繁重的实践练习。

注意

- 要申请本课程的定制培训,请联系我们安排。
21 hours
Overview
本课程面向开发人员,架构师,数据科学家或任何需要密集或定期访问数据的配置文件。

该课程的主要重点是数据处理和转换。

在Hadoop生态系统的工具中,本课程包括Pig和Hive的使用,这两者都大量用于数据转换和操作。

此培训还涉及性能指标和性能优化。

该课程完全是实践性的,并通过理论方面的介绍来打断。
35 hours
Overview
听众:

本课程面向寻求在分布式系统环境中存储和处理大型数据集的解决方案的IT专家

Go :

深入了解Hadoop集群管理。
14 hours
Overview
Tigon是一款开源,实时,低延迟,高吞吐量,本地YARN,位于HDFS和HBase之上的流处理框架,用于实现持久性。 Tigon应用程序可以解决网络入侵检测和分析,社交媒体市场分析,位置分析以及用户实时推荐等使用案例。 这个有指导意义的现场培训介绍了Tigon的混合实时和批处理的方法,因为它会让参与者通过创建示例应用程序。 在培训结束后,参与者将能够: 创建强大的流处理应用程序来处理大量数据流程流源,例如Twitter和Web服务器日志使用Tigon快速连接,过滤和聚合流 听众 开发商 课程的格式 部分讲座,部分讨论,练习和沉重的练习
Hadoop,培训,课程,培训课程, 企业Apache Hadoop培训, 短期Apache Hadoop培训, Apache Hadoop课程, Hadoop周末培训, Apache Hadoop晚上培训, Hadoop训练, 学习Hadoop, Apache Hadoop老师, 学Hadoop班, Apache Hadoop远程教育, 一对一Apache Hadoop课程, 小组Hadoop课程, Apache Hadoop培训师, Apache Hadoop辅导班, Hadoop教程, Apache Hadoop私教, Hadoop辅导, Apache Hadoop讲师

促销课程

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!