课程大纲

介绍

  • Databricks 和 Apache Spark 概述
  • 了解 Databricks 架构

入门

  • 设置环境
  • 设置和配置 Databricks
  • 浏览 Databricks 用户界面
  • 创建 Databricks 工作区

在 Databricks 中处理数据

  • 连接到 Apache Spark 数据源
  • 了解基本列和数据类型
  • 在 Notebook 中管理文件系统

管理作业和集群

  • 创建和配置集群
  • 使用 Notebook 创建作业
  • 运行作业
  • 查看作业和作业详情

在 Databricks 中使用 Delta Lake

  • 将数据加载到 Delta Lake
  • 管理 Delta Lake 中的数据

保护 Databricks

  • 管理 Databricks 安全性
  • 管理备份和恢复

故障排除

总结与后续步骤

要求

  • 具备数据分析的基础知识
  • 了解 Apache Spark

受众

  • 数据工程师
  • 数据科学家
  • 开发人员
 14 小时

即将举行的公开课程

课程分类