课程大纲

  • 第 1 部分:Big Data 和 NoSQL 简介
    • Big Data 生态系统
    • NoSQL 概述
    • CAP定理
    • 何时 NoSQL 合适
    • 列式存储
    • HBase 和 NoSQL
  • 第 2 部分:HBase 介绍
    • 概念和设计
    • 体系结构(HMaster 和区域服务器)
    • 数据完整性
    • HBase 生态系统
    • 实验室:探索 HBase
  • 第 3 部分:HBase 数据模型
    • 命名空间、表和区域
    • 行、列、列族、版本
    • HBase Shell 和管理命令
    • 实验室 : HBase Shell
  • 第 3 部分:Access使用 Java API 处理 HBase
    • Java API 简介
    • 读/写路径
    • 时序数据
    • 扫描
    • Map Reduce(地图缩减)
    • 过滤 器
    • 计数器
    • 协处理器
    • 实验室(多个):使用 HBase Java API 实现  时间序列、Map Reduce、过滤器和计数器。
  • 第 4 部分:HBase 模式设计:小组会议
    • 向学生展示真实世界的用例
    • 学生分组提出设计解决方案
    • 讨论/批评并从多种设计中学习
    • 实验室:在 HBase 中实现方案
  • 第 5 部分:HBase 内部结构
    • 了解 HBase 的底层
    • Memfile / HFile / WAL
    • HDFS 存储
    • 压实
    • 分裂
    • 泛光滤镜
    • 缓存
    • 诊断
  • 第 6 部分:HBase 安装和配置
    • 硬件选型
    • Install 方法
    • 常用配置
    • 实验室:安装 HBase
  • 第 7 部分:HBase 生态系统
    • 使用 HBase 开发应用程序
    • 与其他 Hadoop 堆栈交互(MapReduce、Pig、Hive)
    • 围绕 HBase 的框架
    • 高级概念(协处理器)
    • 实验室:编写 HBase 应用程序
  • 第 8 部分:监控和最佳实践
    • 监测工具和做法
    • 优化 HBase
    • 云中的 HBase
    • HBase 的真实用例
    • 实验室:检查 HBase 生命体征

要求

  • 熟悉 Java 编程语言
  • 熟悉 Java 编程语言(导航 Linux 命令行,使用 vi / nano 编辑文件)
  • 像 Eclipse 或 IntelliJ 这样的 Java IDE

实验室环境:

将为学生提供一个有效的 HBase 集群。学生需要一个 SSH 客户端和一个浏览器来访问集群。

零安装:无需在学生机器上安装HBase软件!

  21 小时
 

人数


开始

完结


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

相关课程

A Practical Introduction to NoSQL Databases

  28 小时

课程分类