感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
Apache Spark 简介
- Spark在大数据处理中的作用
- Spark 体系结构及其组件
设置 Apache Spark
- 硬件和软件要求
- 单机模式和集群模式的安装过程
- 面向系统管理员的配置最佳实践
管理 Spark 群集
- 群集管理工具和技术
- 监视 Spark 应用程序和群集资源
- 安全配置和用户管理
性能调优和优化
- 资源分配和调度
- 调整 Spark 以获得最佳性能
- 识别和解决常见瓶颈
故障排除和问题解决
- 常见的 Spark 管理挑战
- 用于故障排除的诊断工具和技术
- 解决常见问题的分步方法
- 维护正常运行的 Spark 环境的最佳做法
高级管理主题
- 与其他大数据工具集成
- 确保高可用性和灾难恢复
- 升级和扩展 Spark 群集
摘要和后续步骤
要求
- 网络配置和管理的基本知识
- 熟悉 Linux 操作系统和命令行界面
- 有兴趣学习分布式计算系统和大数据管理
观众
- 系统管理员
35 小时
客户评论 (5)
很多实际的例子,处理同一问题的不同方法,有时还不那么明显的技巧如何改进当前的解决方案
Rafal - Nordea
课程 - Apache Spark MLlib
机器翻译
very interactive...
Richard Langford
课程 - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
课程 - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
课程 - Apache Spark in the Cloud
practice tasks