课程大纲

介绍

  • Databricks 和 Apache Spark 概述
  • 了解 Databricks 架构

开始

  • 设置环境
  • 设定与设定Databricks
  • 导航 Databricks 用户介面
  • 创建 Databricks 工作区

在 Databricks 中处理数据

  • 连接到 Apache Spark 数据源
  • 了解基本资讯列和数据类型
  • 在 Notebook 中管理文件系统

管理作业和集群

  • 创建和配置集群
  • 使用 Notebook 建立作业
  • 正在运行的作业
  • 查看任务和任务详细资讯

在 Databricks 中使用 Delta Lake

  • 将数据载入到 Delta Lake 中
  • 在 Delta Lake 中管理数据

固定 Databricks

  • 管理 Databricks 安全性
  • 管理备份和恢复

故障排除

总结和后续步骤

要求

  • 对数据分析有基本的了解
  • 知识 Apache Spark

观众

  • 数据工程师
  • 数据科学家
  • 开发人员
 14 小时

即将举行的公开课程

课程分类