课程大纲
Apache Spark 简介
- Spark在大数据处理中的作用
- Spark 体系结构及其组件
设置 Apache Spark
- 硬件和软件要求
- 单机模式和集群模式的安装过程
- 面向系统管理员的配置最佳实践
管理 Spark 群集
- 群集管理工具和技术
- 监视 Spark 应用程序和群集资源
- 安全配置和用户管理
性能调优和优化
- 资源分配和调度
- 调整 Spark 以获得最佳性能
- 识别和解决常见瓶颈
故障排除和问题解决
- 常见的 Spark 管理挑战
- 用于故障排除的诊断工具和技术
- 解决常见问题的分步方法
- 维护正常运行的 Spark 环境的最佳做法
高级管理主题
- 与其他大数据工具集成
- 确保高可用性和灾难恢复
- 升级和扩展 Spark 群集
摘要和后续步骤
要求
- 网络配置和管理的基本知识
- 熟悉 Linux 操作系统和命令行界面
- 有兴趣学习分布式计算系统和大数据管理
观众
- 系统管理员
客户评论 (8)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
课程 - Python and Spark for Big Data (PySpark)
很多实际的例子,处理同一问题的不同方法,有时还不那么明显的技巧如何改进当前的解决方案
Rafał - Nordea
课程 - Apache Spark MLlib
机器翻译
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
课程 - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Sufficient hands on, trainer is knowledgable
Chris Tan
课程 - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
课程 - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
课程 - Apache Spark in the Cloud
very interactive...
Richard Langford
课程 - SMACK Stack for Data Science
承诺并愿意解释附带主题。
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
课程 - Apache Spark Fundamentals
机器翻译