课程大纲
使用Spark进行高级分析
Big Data在云端
案例研究与最佳实践
使用Apache Spark进行数据处理
Google Colab与Apache Spark简介
优化Big Data工作流程
总结与下一步
在Google Colab中的可视化与Collaboration
- 将Colab与流行的可视化库集成
- 使用Colab笔记本进行协作工作流程
- 分享与导出结果
- 将Google Colab与基于云端的工具集成
- 使用云存储处理大数据
- 在分布式云环境中使用Spark
- 使用Spark MLlib进行机器学习
- 执行实时数据分析
- 使用Spark进行分布式计算
- Google Colab概述
- Apache Spark简介
- 在Google Colab中设置Spark
- 回顾真实世界的大数据应用
- 使用Apache Spark和Colab的案例研究
- 大数据分析的最佳实践
- 调优Spark以提升性能
- 优化内存与存储使用
- 为大数据集扩展工作流程
- 使用RDDs和DataFrames
- 加载与处理大数据集
- 使用Spark SQL查询结构化数据
要求
受众
- 具备数据科学概念的基础知识
- 熟悉Apache Spark
- Python编程技能
- 数据科学家
- 数据工程师
- 从事大数据研究的研究人员
客户评论 (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
课程 - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
课程 - QGIS for Geographic Information System
我喜欢 Pablo 的风格,他涵盖了很多主题,从报告设计、html 定制到实现简单的 ML 算法。Good 平衡理论信息/练习。Pablo 真的涵盖了我感兴趣的所有主题,并全面回答了我的问题。
Cristian Tudose - SC Automobile Dacia SA
课程 - Advanced Data Analysis with TIBCO Spotfire
机器翻译
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
课程 - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location