感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
- 大数据基础知识
- 大数据及其在企业界的作用
- 公司内部大数据战略的发展阶段
- 解释大数据整体方法的基本原理
- 大数据平台所需的组件
- 大数据存储解决方案
- 传统技术的局限性
- 数据库类型概述
- 大数据的四个维度
- 大数据对业务的影响
- 大数据对业务的重要性
- 提取有用数据的挑战
- 将大数据与传统数据相结合
- 大数据存储技术
- 大数据技术概述
- 数据存储模型
- Hadoop的
- 蜂房
- 卡珊德拉
- MongoDB数据库
- 选择正确的大数据技术
- 处理大数据
- 连接数据库并从中提取数据
- 转换和准备用于处理的数据
- 使用Hadoop MapReduce处理分布式数据
- 监视和执行Hadoop MapReduce作业
- Hadoop 分布式文件系统构建块
- Mapreduce和Yarn
- 使用 Spark 处理流数据
- 大数据分析工具和技术
- 使用 Pig Latin 语言对 Hadoop 进行编程
- 使用 Hive 查询大数据
- 使用 Mahout 挖掘数据
- 可视化和报告工具
- 商业中的大数据
- 管理和建立大数据需求
- 大数据对业务的重要性
- 为问题选择正确的大数据工具
数据仓库概念
- 什么是 Data Ware?
- OLTP 和 Data Ware Housing 之间的区别
- 数据采集
- 数据提取
- 数据转换。
- 数据加载
- 数据集市
- 从属数据集市与独立数据集市
- 数据库设计
ETL 测试概念:
- 介绍。
- 软件开发生命周期。
- 测试方法。
- ETL 测试工作流程。
- 数据阶段的 ETL 测试职责。
大数据基础
- Big Data 及其在企业界的作用
- 公司内部 Big Data 战略的发展阶段
- 解释整体方法的基本原理 Big Data
- Big Data 平台所需的组件
- 大数据存储解决方案
- 传统技术的局限性
- 数据库类型概述
否SQL数据库
Hadoop
Map Reduce(地图缩减)
Apache Spark
要求
代表们应该对存储工具有一定的认识和经验,以及处理大型数据集的可怕经验
14 小时
客户评论 (1)
trainer's knowledge