课程大纲

介绍

  • Databricks 和 Apache Spark 概述
  • 了解 Databricks 体系结构

开始

  • 设置环境
  • 设置和配置 Databricks
  • 导航 Databricks 用户界面
  • 创建 Databricks 工作区

在 Databricks 中处理数据

  • 连接到 Apache Spark 数据源
  • 了解基本列和数据类型
  • 将文件系统管理到笔记本中

管理作业和集群

  • 创建和配置集群
  • 使用 Notebook 创建作业
  • 运行作业
  • 查看作业和作业详细信息

在 Databricks 中使用 Delta Lake

  • 将数据加载到 Delta Lake 中
  • 在 Delta Lake 中管理数据

保护 Databricks

  • 管理 Databricks 安全性
  • 管理备份和恢复

故障 排除

摘要和后续步骤

要求

  • 对数据分析有基本的了解
  • 知识 Apache Spark

观众

  • 数据工程师
  • 数据科学家
  • 开发 人员
 14 小时

人数



每位参与者的报价

客户评论 (1)

相关课程

Analytic Functions Fundamentals

21 小时

Apache Arrow for Data Analysis across Disparate Data Sources

14 小时

AWS Glue Fundamentals

14 小时

Azure for Data Engineer

35 小时

数据分析和大数据的实用介绍

35 小时

Data and Analytics - from the ground up

42 小时

Scaling Data Analysis with Python and Dask

14 小时

Data Analysis for Marketers

14 小时

Data Analytics With R

21 小时

Datameer for Data Analysts

14 小时

Data Analysis with Python, Pandas and Numpy

14 小时

A Practical Introduction to Data Science

35 小时

Introduction to dbt Cloud

21 小时

Dremio for Self-Service Data Analysis

21 小时

针对开发人员的Elasticsearch:用Elasticsearch构建搜索和分析解决方案

14 小时

课程分类