联系我们

课程大纲

模块1:Pandas在数据框中的应用

  • Pandas简介
    • 基本数据结构:Series和DataFrame
  • DataFrame操作
    • 数据读取与保存(CSV、Excel等)
    • 基本操作(选择、过滤、索引)
  • 数据修改
    • 添加、删除列和行
    • 修改DataFrame中的值
  • 数据聚合与分组
    • GroupBy
    • 聚合、求和、平均值等
  • DataFrame合并与连接
    • merge、join、concat
  • 处理缺失数据
    • 识别缺失数据
    • 填补缺失数据的方法

模块2:程序运行时间优化

  • 优化简介
    • 编程中优化的重要性
  • 代码优化
    • 高效的数据结构
    • 避免重复计算
    • 循环优化
  • Pandas优化
    • 向量化操作
    • 避免使用apply和lambda
    • 处理大数据集
  • 通过创建函数简化代码
    • 创建和使用函数
    • 代码重构

模块3:NumPy库的使用

  • NumPy简介
    • 导入库
    • 基本数据结构:ndarray
  • 数组操作
    • 创建和修改数组
    • 数组索引和切片
  • 数学和统计函数
    • 基本数学操作
    • 统计和聚合函数
  • 线性代数
    • 矩阵乘法
    • 行列式、逆矩阵
  • 处理多维数据
    • 2D、3D及更高维数组
    • 数组形状变换
  • 与其他库的集成

模块4:使用Python创建Excel图表

  • openpyxl和xlsxwriter简介
  • 在Excel中创建图表
    • 创建简单图表(折线图、柱状图等)
    • 图表格式化
  • 将图表生成为图像(PNG)
    • 使用matplotlib生成图表
    • 将图表保存为PNG文件
  • Excel中的高级图表
  • 报告自动化
    • 创建带有图表的自动化报告
    • 将Pandas与openpyxl/xlsxwriter结合使用
 16 小时

即将举行的公开课程

课程分类