Hadoop培训课程

Hadoop培训课程

在线或现场、由讲师指导的实时 Apache Hadoop 培训课程通过交互式实践演示 Hadoop 生态系统的核心组件以及如何使用这些技术来解决大规模问题。 Hadoop 培训可作为“在线实时培训”或“现场实时培训”。在线实时培训(又名“远程实时培训”)是通过交互式远程桌面进行的。现场现场培训可以在 中国 中的客户场所本地进行,也可以在 中国 中的 NobleProg 公司培训中心进行。 NobleProg——您当地的培训提供商

Machine Translated

Hadoop Course Outlines

课程名称
课程时长
课程概览
课程名称
课程时长
课程概览
21小时
Python是数据科学和机械学习的可扩展、灵活和广泛使用的编程语言。 Spark 是一款用于查询、分析和转换大数据的数据处理引擎,而 Hadoop 是用于大规模数据存储和处理的软件图书馆框架。 由教练引导,现场培训(在线或在线)旨在开发人员想要使用和整合Spark,(0)和(1)来处理,分析和转型大型和复杂的数据集。 在本研讨会结束后,参与者将能够:
    设置必要的环境,以便在 Spark, Hadoop, 和 Python 开始处理大数据。 了解Spark和0的特性、核心组件和建筑。 了解如何集成 Spark, Hadoop, 和 Python 大数据处理。 探索Spark生态系统中的工具(Spark MlLib, Spark Streaming,Kafka,Sqoop,Kafka,和Flume)。 建立协作过滤推荐系统类似于(3)、YouTube、Amazon、Spotify和(2)ogle。 使用 Apache Mahout 来扩展机器学习算法。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
7小时
This course covers how to use Hive SQL language (AKA: Hive HQL, SQL on Hive, HiveQL) for people who extract data from Hive
14小时
Datameer是基于Hadoop构建的商业智能和分析平台。它允许最终用户以易用的方式访问,探索和关联大规模,结构化,半结构化和非结构化数据。 在这个有指导意义的实时培训中,参与者将学习如何使用Datameer来克服Hadoop陡峭的学习曲线,因为他们将逐步完成对一系列大数据源的设置和分析。 在培训结束后,参与者将能够: 创建,策划和交互式地探索企业数据湖访问商业智能数据仓库,交易数据库和其他分析商店使用电子表格用户界面设计端对端数据处理管道访问预建功能来探索复杂的数据关系使用拖放式向导来可视化数据并创建仪表板使用表格,图表,图形和地图来分析查询结果 听众 数据分析师 课程的格式 部分讲座,部分讨论,练习和沉重的练习
21小时
The course is dedicated to IT specialists that are looking for a solution to store and process large data sets in distributed system environment Course goal: Getting knowledge regarding Hadoop cluster administration
35小时
听众: 本课程面向寻求在分布式系统环境中存储和处理大型数据集的解决方案的IT专家 Go : 深入了解Hadoop集群管理。
28小时
Audience: This course is intended to demystify big data/hadoop technology and to show it is not difficult to understand.
28小时
Apache Hadoop is the most popular framework for processing Big Data on clusters of servers. This course will introduce a developer to various components (HDFS, MapReduce, Pig, Hive and HBase) Hadoop ecosystem.  
21小时
Apache Hadoop是用于处理服务器群集上的Big Data的最流行的框架之一。本课程深入研究HDFS,高级Pig, Hive和HBase中的数据管理。这些高级编程技术将有益于经验丰富的Hadoop开发人员。 观众 :开发者 持续时间:三天 格式:讲座(50%)和动手实验室(50%)。
21小时
This course introduces HBase – a NoSQL store on top of Hadoop.  The course is intended for developers who will be using HBase to develop applications,  and administrators who will manage HBase clusters. We will walk a developer through HBase architecture and data modelling and application development on HBase. It will also discuss using MapReduce with HBase, and some administration topics, related to performance optimization. The course  is very  hands-on with lots of lab exercises.
Duration : 3 days Audience : Developers  & Administrators
21小时
Apache Hadoop是用于处理服务器群集上的Big Data的最流行的框架。在这三天(可选择四天)课程中,与会者将了解Hadoop及其生态系统的业务优势和用例,如何规划群集部署和增长,如何安装,维护,监控,排除故障和优化Hadoop 。他们还将练习集群批量数据加载,熟悉各种Hadoop发行版,并练习安装和管理Hadoop生态系统工具。本课程结束时讨论了使用Kerberos保护集群。 “......材料准备得很充分,并且要彻底覆盖。该实验室非常有帮助,组织良好“
- Andrew Nguyen,微软在线Advertising首席集成DW工程师听众 Hadoop管理员格式讲座和动手实验,大约平衡60%的讲座,40%的实验室。
21小时
Apache Hadoop is the most popular framework for processing Big Data. Hadoop provides rich and deep analytics capability, and it is making in-roads in to tradional BI analytics world. This course will introduce an analyst to the core components of Hadoop eco system and its analytics Audience Business Analysts Duration three days Format Lectures and hands on labs.
21小时
Hadoop是最受欢迎的Big Data处理框架。
14小时
Audience
  • Developers
Format of the Course
  • Lectures, hands-on practice, small tests along the way to gauge understanding
21小时

本课程面向开发人员,架构师,数据科学家或任何需要密集或定期访问数据的配置文件。 该课程的主要重点是数据处理和转换。 在Hadoop生态系统的工具中,本课程包括Pig和Hive的使用,这两者都大量用于数据转换和操作。 此培训还涉及性能指标和性能优化。 该课程完全是实践性的,并通过理论方面的介绍来打断。
14小时
In this instructor-led training in 中国, participants will learn the core components of the Hadoop ecosystem and how these technologies can be used to solve large-scale problems. By learning these foundations, participants will  improve their ability to communicate with the developers and implementers of these systems as well as the data scientists and analysts that many IT projects involve. Audience
  • Project Managers wishing to implement Hadoop into their existing development or IT infrastructure
  • Project Managers needing to communicate with cross-functional teams that include big data engineers, data scientists and business analysts
14小时
Apache Samza是一个用于流处理的开源近实时异步计算框架。它使用Apache Kafka进行消息传递,使用Apache Kafka Hadoop YARN进行容错,处理器隔离,安全性和资源管理。 这个由讲师指导的实时培训介绍了消息传递系统和分布式流处理背后的原理,同时通过创建基于Samza的示例项目和作业执行来引导参与者。 在培训结束时,参与者将能够:
  • 使用Samza简化生成和使用消息所需的代码。
  • 解耦来自应用程序的消息处理。
  • 使用Samza实现近实时异步计算。
  • 使用流处理为消息传递系统提供更高级别的抽象。
听众
  • 开发商
课程形式
  • 部分讲座,部分讨论,练习和繁重的实践练习
7小时
Alluxio 是一个开源的虚拟分布式存储系统,结合了不同存储系统,并允许应用程序以内存速度与数据进行互动。 它由Intel、Baidu 和 Alibaba 等公司使用。 在本导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导 在本研讨会结束后,参与者将能够:
    开发一个应用程序与 Alluxio 连接大数据系统和应用程序同时保持一个名称空间 有效地从任何存储格式中的大数据中提取值 提高工作负载性能 分配和管理 Alluxio 单独或集成
观众
    数据科学家 开发者 系统管理员
课程格式
    部分讲座,部分讨论,练习和重实习
14小时
Tigon是一款开源,实时,低延迟,高吞吐量,本地YARN,位于HDFS和HBase之上的流处理框架,用于实现持久性。 Tigon应用程序可以解决网络入侵检测和分析,社交媒体市场分析,位置分析以及用户实时推荐等使用案例。 这个有指导意义的现场培训介绍了Tigon的混合实时和批处理的方法,因为它会让参与者通过创建示例应用程序。 在培训结束后,参与者将能够: 创建强大的流处理应用程序来处理大量数据流程流源,例如Twitter和Web服务器日志使用Tigon快速连接,过滤和聚合流 听众 开发商 课程的格式 部分讲座,部分讨论,练习和沉重的练习
21小时
Apache NiFi (Hortonworks DataFlow)是一个实时集成的数据物流和简单的事件处理平台,可以在系统之间移动,跟踪和自动化数据。它使用基于流的编程编写,并提供基于Web的用户界面,以实时管理数据流。 在这个由讲师指导的现场培训(现场或远程)中,参与者将学习如何在实验室环境中部署和管理Apache NiFi 。 在培训结束时,参与者将能够:
  • 安装和配置Apachi NiFi。
  • 从不同的分布式数据源(包括数据库和大数据湖)获取,转换和管理数据。
  • 自动化数据流。
  • 启用流式分析。
  • 应用各种方法进行数据摄取。
  • 将Big Data转化为业务洞察力。
课程格式
  • 互动讲座和讨论。
  • 大量的练习和练习。
  • 在实时实验室环境中亲自实施。
课程自定义选项
  • 要申请本课程的定制培训,请联系我们安排。
7小时
Apache NiFi (Hortonworks DataFlow)是一个实时集成的数据物流和简单的事件处理平台,可以在系统之间移动,跟踪和自动化数据。它使用基于流的编程编写,并提供基于Web的用户界面,以实时管理数据流。 在这个以讲师为主导的现场培训中,参与者将学习基于流程的编程的基础知识,因为他们使用Apache NiFi开发了许多演示扩展,组件和处理器。 在培训结束时,参与者将能够:
  • 了解NiFi的架构和数据流概念。
  • 使用NiFi和第三方API开发扩展。
  • 定制开发自己的Apache Nifi处理器。
  • 从不同的和不常见的文件格式和数据源中提取和处理实时数据。
课程格式
  • 互动讲座和讨论。
  • 大量的练习和练习。
  • 在实时实验室环境中亲自实施。
课程自定义选项
  • 要申请本课程的定制培训,请联系我们安排。
28小时
Hadoop 是著名的 Big Data 处理框架。 Python是高级编程语言,以其清晰的合成和编码可读性而闻名。 在本导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导导。 在本研讨会结束后,参与者将能够:
    了解背后的基本概念 Hadoop, MapReduce, Pig, 和 Spark 使用 Python 与 Hadoop 分布式文件系统(HDFS),MapReduce,猪,和Spark 使用 Snakebite 以编程访问 HDFS 内部 Python 使用 mrjob 写 MapReduce 工作在 Python 写 Spark 程序与 Python 使用 Python UDF 扩展猪的功能 管理 MapReduce 工作和使用 Luigi 的猪脚本
观众
    开发者 IT 专业人士
课程格式
    部分讲座,部分讨论,练习和重实习
14小时
Sqoop是一个开源软件工具,用于在Hadoop和关系数据库或大型机之间传输数据。它可用于将数据从关系数据库管理系统(RDBMS)(如My SQL或Oracle或大型机)导入Hadoop分布式文件系统(HDFS)。此后,可以在Hadoop MapReduce中转换数据,然后将其重新导出回RDBMS。 在这个由讲师指导的实时培训中,参与者将学习如何使用Sqoop将数据从传统的关系数据库导入Hadoop存储,如HDFS或Hive ,反之亦然。 在培训结束时,参与者将能够:
  • 安装并配置Sqoop
  • 将数据从My SQL导入HDFS和Hive
  • 将数据从HDFS和Hive导入My SQL
听众
  • 系统管理员
  • 数据工程师
课程 格式
  • 部分讲座,部分讨论,练习和繁重的实践练习
注意
  • 要申请本课程的定制培训,请联系我们安排。
21小时
大数据分析涉及检查大量不同数据集的过程,以便发现相关性,隐藏模式和其他有用的见解。 健康产业拥有大量复杂的异构医学和临床数据。对健康数据应用大数据分析在获得改善医疗保健服务的见解方面具有巨大潜力。然而,这些数据集的巨大性给分析和临床环境的实际应用带来了巨大挑战。 在这个以讲师为主导的现场培训(远程)中,参与者将学习如何在健康状况下进行大数据分析,因为他们将逐步进行一系列动手实践练习。 在培训结束时,参与者将能够:
  • 安装和配置大数据分析工具,如Hadoop MapReduce和Spark
  • 了解医疗数据的特征
  • 应用大数据技术处理医疗数据
  • 在健康应用的背景下研究大数据系统和算法
听众
  • 开发商
  • 数据科学家
课程格式
  • 部分讲座,部分讨论,练习和繁重的实践练习。
注意
  • 要申请本课程的定制培训,请联系我们安排。
35小时
Apache Hadoop 是一个流行的数据处理框架,用于在许多计算机上处理大数据集。 由教练领导,现场培训(在线或在线)旨在系统管理员谁想要学习如何在他们的组织内设置,部署和管理 Hadoop 集群。 在本研讨会结束后,参与者将能够:
    安装和配置 Apache Hadoop. 了解生态系统的四个主要组成部分:HDFS、MapReduce、YARN和0 Common。 使用分布式文件系统(HDFS)将一个集群扩展到数百或数千个节点。   设置 HDFS 作为存储发动机在前置 Spark 部署。 设置 Spark 以获取替代存储解决方案,如 Amazon S3 和 NoSQL 数据库系统,如 Redis, Elasticsearch, Couchbase, Aerospike 等。 执行行政任务,如提供,管理,监测和保证一个 Apache Hadoop 集群。
课程格式
    互动讲座和讨论。 很多练习和练习。 在现场实验室环境中进行手动实施。
课程定制选项
    要申请此课程的定制培训,请联系我们安排。
21小时
Cloudera Impala 是一个用于 Apache Hadoop 集群的开源大规模并行处理 (MPP) SQL 查询引擎。 Impala 使用户能够 对存储在 Hadoop 分布式文件系统 和 Apache Hbase 中的数据发出低延迟 SQL 查询,而无需数据移动或转换。 观众 本课程面向分析师和数据科学家,通过 商业智能或SQL工具对 存储在Hadoop中的数据进行分析。 完成本课程后,代表们将能够
    使用 Impala 从 Hadoop 集群中提取有意义的信息。 编写特定的程序,以促进斑羚SQL方言的商业智能。 排查黑斑羚问题。
21小时
Apache Ambari是一个开源管理平台,用于配置,管理,监控和保护Apache Hadoop集群。 在这个由讲师指导的实时培训中,参与者将学习Ambari提供的管理工具和实践,以成功管理Hadoop集群。 在培训结束时,参与者将能够:
  • 使用Ambari设置实时Big Data集群
  • 将Ambari的高级功能和功能应用于各种用例
  • 根据需要无缝添加和删除节点
  • 通过调整和调整来改善Hadoop集群的性能
听众
  • DevOps
  • 系统管理员
  • 数据库管理员
  • Hadoop测试专业人士
课程形式
  • 部分讲座,部分讨论,练习和繁重的实践练习
21小时
Hortonworks Data Platform (HDP)是一个开源的Apache Hadoop支持平台,为在Apache Hadoop生态系统上开发大数据解决方案提供了稳定的基础。 这个由讲师指导的现场培训(现场或远程)介绍了Hortonworks Data Platform (HDP)并引导参与者完成Spark + Hadoop解决方案的部署。 在培训结束时,参与者将能够:
  • 使用Hortonworks可以大规模可靠地运行Hadoop 。
  • 使用Spark的敏捷分析工作流统一Hadoop的安全性,治理和运营功能。
  • 使用Hortonworks调查,验证,认证和支持Spark项目中的每个组件。
  • 处理不同类型的数据,包括结构化,非结构化,动态和静止。
课程格式
  • 互动讲座和讨论。
  • 大量的练习和练习。
  • 在实时实验室环境中亲自实施。
课程自定义选项
  • 要申请本课程的定制培训,请联系我们安排。

Last Updated:

Hadoop,培训,课程,培训课程, 企业Apache Hadoop培训, 短期Apache Hadoop培训, Apache Hadoop课程, Hadoop周末培训, Apache Hadoop晚上培训, Hadoop训练, 学习Hadoop, Apache Hadoop老师, 学Hadoop班, Apache Hadoop远程教育, 一对一Apache Hadoop课程, 小组Hadoop课程, Apache Hadoop培训师, Apache Hadoop辅导班, Hadoop教程, Apache Hadoop私教, Hadoop辅导, Apache Hadoop讲师

促销课程

目前没有课程折扣

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

该网站在其他国家/地区