课程大纲

介绍

  • AWS Glue 及其组件概述
  • 理解 AWS Glue 组件和架构
  • AWS Glue 的优势和局限性

使用数据目录

  • 理解 AWS Glue 爬虫和数据目录
  • 创建数据库
  • 创建表
  • 使用爬虫
  • 构建自定义分类器

AWS Glue 开发端点

  • 使用开发笔记本
  • 理解 Glue 上下文和动态帧
  • 创建动态帧

AWS Glue 转换

  • 应用转换
  • 解决选择
  • 选择和重命名
  • 删除字段
  • 使用过滤器
  • 使用映射
  • 连接
  • Spigot
  • 扁平化 JSON

理解 Glue 工作流

  • 使用 Glue 作业
  • 使用触发器

调试

  • 修复脚本检索错误
  • 修复启动错误
  • 修复 Glue 参数错误
  • 修复策略错误

总结与下一步

要求

  • 了解 ETL 概念
  • 具备 Python 编程的基础知识

受众

  • 数据工程师
  • 数据分析师
 14 小时

客户评论 (4)

即将举行的公开课程

课程分类