课程大纲

大数据概述:

  • 什么是 Big Data
  • 为什么 Big Data 越来越受欢迎
  • Big Data 案例研究
  • Big Data 特点
  • 要处理的解决方案 Big Data。

Hadoop 及其组成部分:

  • 什么是 Hadoop 以及它的组成部分是什么。
  • Hadoop 架构及其可以处理的数据的特征 /Process.
  • 简要介绍 Hadoop 历史、使用它的公司以及他们为什么开始使用它。
  • Hadoop 框架工作及其组件 - 详细解释。
  • 什么是 HDFS 和读取 - 写入 Hadoop 分布式文件系统。
  • 如何设置不同模式下的 Hadoop 集群 - 独立/伪/多节点集群。

(这包括在VirtualBox/KVM/VMware中设置Hadoop集群,需要仔细研究的网络配置,运行Hadoop守护进程和测试集群)。

  • 什么是Map Reduce帧工作及其工作原理。
  • 在 Hadoop 集群上运行 Map Reduce 作业。
  • 了解 Hadoop 集群上下文中的复制、镜像和机架感知。

Hadoop 集群规划:

  • 如何规划 hadoop 集群。
  • 了解硬件-软件以规划 hadoop 集群。
  • 了解工作负载并规划群集以避免故障并执行最佳性能。

什么是 MapR 以及为什么 MapR:

  • MapR 及其体系结构概述。
  • 了解和工作MapR控制系统,MapR卷,快照和镜像。
  • 在 MapR 上下文中规划群集。
  • MapR 与其他发行版和 Apache 的比较 Hadoop。
  • MapR 安装和群集部署。

集群设置和管理:

  • 管理服务、节点、快照、镜像卷和远程集群。
  • 了解和管理节点。
  • 了解 Hadoop 组件,将 Hadoop 组件与 MapR 服务一起安装。
  • 访问集群上的数据,包括通过 NFS 管理服务和节点。
  • 通过使用卷管理数据,管理用户和组,管理和分配节点角色,调试节点停用,集群管理和性能监控,配置/分析和监控指标以监控性能,配置和管理MapR安全性。
  • 了解并使用 M7- MapR 表的本机存储。
  • 群集配置和调优以获得最佳性能。

群集升级以及与其他设置的集成:

  • 升级MapR的软件版本和升级类型。
  • 配置 Mapr 集群以访问 HDFS 集群。
  • 在 Amazon Elastic MapReduce 上设置 MapR 集群。

上述所有主题都包括演示和练习课程,供学习者亲身体验该技术。

要求

  • Linux FS 的基础知识
  • 基本 Java
  • Apache Hadoop知识(推荐)
 28 小时

人数



每位参与者的报价

客户评论 (1)

相关课程

课程分类