sparkpython
21 小时 通常来说是3天,包括中间休息。
Spark是一个用于查询、分析和转换大数据的数据处理引擎。Python是一种高级编程语言,因其清晰的语法和代码可读性而闻名。PySpark允许用户将Spark与Python连接。
在这一由讲师引导的现场培训中,学员将通过实践练习学习如何使用Python和Spark一起分析大数据。
在本次培训结束后,学员将能够:
受众
课程形式
介绍
了解大数据
Spark概述
Python概述
PySpark概述
设置Python和Spark
设置PySpark
针对Spark使用Amazon Web Services(AWS)EC2实例
设置数据块
设置AWS EMR集群
学习Python编程的基础知识
学习Spark DataFrame的基础知识
进行Spark DataFrame项目练习
了解用MLlib进行机器学习
使用MLlib、Spark和Python进行机器学习
了解回归
了解随机森林(Random Forests)和决策树(Decision Trees)
使用K均值聚类
使用推荐系统
实现自然语言处理
在Python中用Spark进行流式处理
结束语
We are looking to expand our presence in China!
If you are interested in running a high-tech, high-quality training and consulting business.
Apply now!















.jpg)



.jpg)














.jpg)












