课程大纲

  1. 大数据基础知识
  2. 大数据及其在企业界的作用
  3. 公司内部大数据战略的发展阶段
  4. 解释大数据整体方法的基本原理
  5. 大数据平台所需的组件
  6. 大数据存储解决方案
  7. 传统技术的局限性
  8. 数据库类型概述
  9. 大数据的四个维度
  10. 大数据对业务的影响
  11. 大数据对业务的重要性
  12. 提取有用数据的挑战
  13. 将大数据与传统数据相结合
  14. 大数据存储技术
  15. 大数据技术概述
  16. 数据存储模型
  17. Hadoop的
  18. 蜂房
  19. 卡珊德拉
  20. MongoDB数据库
  21. 选择正确的大数据技术
  22. 处理大数据
  23. 连接数据库并从中提取数据
  24. 转换和准备用于处理的数据
  25. 使用Hadoop MapReduce处理分布式数据
  26. 监视和执行Hadoop MapReduce作业
  27. Hadoop 分布式文件系统构建块
  28. Mapreduce和Yarn
  29. 使用 Spark 处理流数据
  30. 大数据分析工具和技术
  31. 使用 Pig Latin 语言对 Hadoop 进行编程
  32. 使用 Hive 查询大数据
  33. 使用 Mahout 挖掘数据
  34. 可视化和报告工具
  35. 商业中的大数据
  36. 管理和建立大数据需求
  37. 大数据对业务的重要性
  38. 为问题选择正确的大数据工具

 

数据仓库概念

  • 什么是 Data Ware?
  • OLTP 和 Data Ware Housing 之间的区别
  • 数据采集
  • 数据提取
  • 数据转换。
  • 数据加载
  • 数据集市
  • 从属数据集市与独立数据集市
  • 数据库设计

ETL 测试概念:

  • 介绍。
  • 软件开发生命周期。
  • 测试方法。
  • ETL 测试工作流程。
  • 数据阶段的 ETL 测试职责。

大数据基础

  • Big Data 及其在企业界的作用
  • 公司内部 Big Data 战略的发展阶段
  • 解释整体方法的基本原理 Big Data
  • Big Data 平台所需的组件
  • 大数据存储解决方案
  • 传统技术的局限性
  • 数据库类型概述

否SQL数据库

Hadoop

Map Reduce(地图缩减)

Apache Spark

 

要求

代表们应该对存储工具有一定的认识和经验,以及处理大型数据集的可怕经验

  14 小时
 

人数


开始

完结


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

客户评论 (1)

相关课程

课程分类