课程大纲

应用机器学习导论

  • 统计学习与机器学习
  • 迭代与评估
  • 偏差-方差权衡
  • 监督学习与无监督学习
  • 机器学习解决的问题
  • 训练验证测试——避免过拟合的机器学习工作流程
  • 机器学习的工作流程
  • 机器学习算法
  • 为问题选择合适的算法

算法评估

  • 数值预测评估
    • 准确性度量:ME, MSE, RMSE, MAPE
    • 参数和预测稳定性
  • 分类算法评估
    • 准确性及其问题
    • 混淆矩阵
    • 不平衡类别问题
  • 模型性能可视化
    • 利润曲线
    • ROC曲线
    • 提升曲线
  • 模型选择
  • 模型调优——网格搜索策略

建模数据准备

  • 数据导入与存储
  • 理解数据——基本探索
  • 使用pandas库进行数据操作
  • 数据转换——数据整理
  • 探索性分析
  • 缺失值——检测与解决方案
  • 异常值——检测与策略
  • 标准化、归一化、二值化
  • 定性数据重新编码

用于异常检测的机器学习算法

  • 监督算法
    • KNN
    • 集成梯度提升
    • SVM
  • 无监督算法
    • 基于距离的方法
    • 基于密度的方法
    • 基于概率的方法
    • 基于模型的方法

理解深度学习

  • 深度学习基本概念概述
  • 区分机器学习与深度学习
  • 深度学习应用概述

神经网络概述

  • 什么是神经网络
  • 神经网络与回归模型
  • 理解数学基础与学习机制
  • 构建人工神经网络
  • 理解神经节点与连接
  • 处理神经元、层及输入输出数据
  • 理解单层感知器
  • 监督学习与无监督学习的区别
  • 学习前馈与反馈神经网络
  • 理解前向传播与反向传播

使用Keras构建简单的深度学习模型

  • 创建Keras模型
  • 理解数据
  • 指定深度学习模型
  • 编译模型
  • 拟合模型
  • 处理分类数据
  • 处理分类模型
  • 使用模型

使用TensorFlow进行深度学习

  • 数据准备
    • 下载数据
    • 准备训练数据
    • 准备测试数据
    • 缩放输入
    • 使用占位符和变量
  • 指定网络架构
  • 使用成本函数
  • 使用优化器
  • 使用初始化器
  • 拟合神经网络
  • 构建图
    • 推理
    • 损失
    • 训练
  • 训练模型
    • 会话
    • 训练循环
  • 评估模型
    • 构建评估图
    • 使用评估输出进行评估
  • 大规模训练模型
  • 使用TensorBoard可视化与评估模型

深度学习在异常检测中的应用

  • 自编码器
    • 编码器-解码器架构
    • 重建损失
  • 变分自编码器
    • 变分推断
  • 生成对抗网络
    • 生成器-判别器架构
    • 使用GAN进行异常检测的方法

集成框架

  • 结合不同方法的结果
  • 自助聚合
  • 平均异常值分数

要求

  • 具备Python编程经验
  • 对统计和数学概念有基本了解

受众

  • 开发者
  • 数据科学家
 28 小时

客户评论 (5)

即将举行的公开课程

课程分类