课程大纲

介绍

  • 人工神经网络与基于决策树的算法

XGBoost 功能概述

  • 梯度提升算法的元素
  • 专注于计算速度和模型性能
  • XGBoost 与逻辑回归、Random Forest 和标准梯度提升

基于树的算法的演变

  • 决策树、装袋、Random Forest、提升、梯度提升
  • 系统优化
  • 算法增强

准备环境

  • 安装 SciPy 和 scikit-learn

创建 XGBoost 模型

  • 下载数据集
  • 解决常见的分类问题
  • 训练 XGBoost 模型进行分类
  • 解决常见的回归任务

监控性能

  • 评估和报告绩效
  • 提早停止

按重要性绘制要素

  • 计算特征重要性
  • 决定保留或放弃哪些输入变量

配置梯度提升

  • 查看训练和验证数据集的学习曲线
  • 调整学习率
  • 调整树的数量

超参数调优

  • 提高 XGBoost 模型的性能
  • 设计一个对照实验来调整超参数
  • Search参数组合

创建流水线

  • 将 XGBoost 模型合并到端到端机器学习管道中
  • 优化管道中的超参数
  • 先进的预处理技术

故障 排除

总结和结论

要求

  • 具有编写机器学习模型的经验

观众

  • 数据科学家
  • 机器学习工程师
 14 小时

人数



每位参与者的报价

课程分类