课程大纲

介绍Databricks与金融Use Case

  • 了解Databricks生态系统
  • 金融数据分析工作流程概述
  • 使用案例示例:风险建模、财务报告、审计日志

Databricks Notebooks入门

  • 创建和导航notebooks
  • 在Databricks中使用Python和SQL
  • 通过评论和版本历史进行协作

数据导入与清理

  • 从CSV、数据库和API导入金融数据
  • 使用Spark DataFrames进行清理和准备
  • 处理缺失值和异常值

转换与聚合金融数据

  • 计算KPI和财务比率
  • 过滤、分组和数据透视
  • 时间序列操作与重采样

金融洞察可视化

  • 使用Databricks可视化工具创建仪表板
  • 为财务报告定制图表
  • 导出可视化内容用于演示或监管审查

查询优化与使用Delta Lake

  • Delta Lake架构介绍
  • ACID事务与数据可靠性
  • 通过数据分区提高性能

Collaboration、调度与共享

  • 管理财务团队的访问权限
  • 调度自动化报告任务
  • 安全导出数据和结果

总结与下一步

要求

  • 理解数据分析概念
  • 具备Python或SQL的使用经验
  • 熟悉财务数据类型和报告

目标受众

  • 财务分析师和商业智能专业人员
  • 在金融领域工作的数据分析师
  • 支持财务团队的数据工程师
 14 小时

即将举行的公开课程

课程分类