课程大纲

高级转换构建模块

  • 处理复杂数据类型。
  • 管理字段、元数据和动态结构。
  • 可重用的转换模式。

参数、变量与面向作业的设计

  • 运行时变量与作用域。
  • 参数化转换。
  • 父子作业结构。

数据库集成与查找策略

  • 高级查找步骤。
  • 缓存策略。
  • 高效的连接设计。

处理文件、API 与外部系统

  • 处理 JSON 和 XML。
  • 调用 REST 和 SOAP 服务。
  • 流式与批量加载。

错误处理与数据质量技术

  • 捕获与路由错误。
  • 数据验证模式。
  • 审计与日志记录。

性能调优要点

  • 优化步骤设计。
  • 内存与线程考虑。
  • 检测瓶颈。

基于仓库的开发简介

  • 使用 Pentaho 仓库。
  • 版本管理。
  • 团队协作实践。

部署与迁移实践

  • 在环境之间迁移作业。
  • 配置管理。
  • 操作最佳实践。

总结与下一步

要求

  • 了解 ETL 基础知识。
  • 具备 Pentaho Data Integration 使用经验。
  • 具备数据仓库概念的基本知识。

受众

  • ETL 开发人员。
  • 数据工程师。
  • 希望扩展 PDI 技能的技术专业人员。
 21 小时

客户评论 (2)

即将举行的公开课程

课程分类