课程大纲

介绍

  • Databricks 和 Apache Spark 概述
  • 了解 Databricks 体系结构

开始

  • 设置环境
  • 设置和配置 Databricks
  • 导航 Databricks 用户界面
  • 创建 Databricks 工作区

在 Databricks 中处理数据

  • 连接到 Apache Spark 数据源
  • 了解基本列和数据类型
  • 将文件系统管理到笔记本中

管理作业和集群

  • 创建和配置集群
  • 使用 Notebook 创建作业
  • 运行作业
  • 查看作业和作业详细信息

在 Databricks 中使用 Delta Lake

  • 将数据加载到 Delta Lake 中
  • 在 Delta Lake 中管理数据

保护 Databricks

  • 管理 Databricks 安全性
  • 管理备份和恢复

故障 排除

摘要和后续步骤

要求

  • 对数据分析有基本的了解
  • 知识 Apache Spark

观众

  • 数据工程师
  • 数据科学家
  • 开发 人员
 14 小时

人数



每位参与者的报价

客户评论 (2)

相关课程

课程分类