感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
介绍
- Spark 和 Hadoop 功能和体系结构概述
- 了解大数据
- Python 编程基础
开始
- 设置 Python、Spark 和 Hadoop
- 了解 Python 中的数据结构
- 了解 PySpark API
- 了解 HDFS 和 MapReduce
将 Spark 和 Hadoop 与 Python 集成
- 在 Python 中实现 Spark RDD
- 使用MapReduce处理数据
- 在HDFS中创建分布式数据集
Machine Learning 使用 Spark MLlib
处理 Big Data 和 Spark Streaming
使用推荐系统
使用 Kafka、Sqoop、Kafka 和 Flume
使用 Spark 和 Hadoop 的 Apache Mahout
故障 排除
摘要和后续步骤
要求
- 具有 Spark 和 Hadoop 的经验
- Python 编程经验
观众
- 数据科学家
- 开发 人员
21 小时
客户评论 (3)
我们能够带走大部分的信息、课程、演示和练习,这样我们可以回顾它们,或许重新做我们第一次没理解的部分,或者改进我们已经完成的内容。
Raul Mihail Rat - Accenture Industrial SS
课程 - Python, Spark, and Hadoop for Big Data
机器翻译
我喜欢它能够奠定主题的基础,并深入到一些相当高级的练习。同时,它还提供了编写/测试代码的简便方法。
Ionut Goga - Accenture Industrial SS
课程 - Python, Spark, and Hadoop for Big Data
机器翻译
实际案例
Ahmet Bolat - Accenture Industrial SS
课程 - Python, Spark, and Hadoop for Big Data
机器翻译