感谢您的预订!我们的团队成员将会尽快与您取得联系。
感谢您的预订!我们的团队成员将会尽快与您取得联系。
课程大纲
- 介绍
- Hadoop 历史、概念
- 生态系统
- 分布
- 高级体系结构
- Hadoop 神话
- Hadoop 挑战(硬件/软件)
- 实验室:讨论您的大数据项目和问题
- HDFS 操作
- 概念(水平扩展、复制、数据局部性、机架感知)
- 节点和守护进程(NameNode、辅助 NameNode、HA 备用 NameNode、DataNode)
- 运行状况监视
- 基于命令行和浏览器的管理
- 添加存储,更换有缺陷的驱动器
- 实验:熟悉 HDFS 命令行
- MapReduce操作和管理
- mapreduce之前的并行计算:比较HPC与Hadoop管理
- MapReduce集群负载
- 节点和守护程序(JobTracker、TaskTracker)
- MapReduce UI演练
- Mapreduce配置
- 作业配置
- 优化MapReduce
- 万无一失的MR:对程序员说些什么
- 实验:运行MapReduce示例
- 高级主题
- 硬件监控
- 集群监控
- 添加和删除服务器,升级 Hadoop
- 备份、恢复和业务连续性规划
- Oozie 作业工作流
- Hadoop 高可用性 (HA)
- Hadoop 联邦
- 使用 Kerberos 保护群集
- 实验室:设置监视
要求
- 熟悉基本的 Linux 系统管理
- 基本脚本编写技能
Hadoop 和分布式计算的知识不是必需的,但将在课程中介绍和解释。
实验室环境
零安装:无需在学生机器上安装hadoop软件!将为学生提供一个有效的hadoop集群。
学生将需要以下内容
- SSH 客户端(Linux 和 Mac 已经有 ssh 客户端,对于 Windows ,建议使用 Putty )
- 用于访问群集的浏览器。我们建议 安装有 FoxyProxy扩展的 Firefox浏览器
21 小时
客户评论 (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
课程 - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
课程 - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay