课程大纲

介绍

  • 人工神经网路与基于决策树的演算法

XGBoost 功能概述

  • Elements 的 Gradient Boosting 演算法
  • 专注于计算速度和模型性能
  • XGBoost vs Logistic 回归 Random Forest 和标准梯度提升

基于树的演算法的演变

  • 决策树、装袋、Random Forest、提升、梯度提升
  • 系统优化
  • 演演算法增强功能

准备环境

  • 安装 SciPy 和 scikit-learn

创建 XGBoost 模型

  • 下载数据集
  • 解决常见的分类问题
  • 训练 XGBoost 模型进行分类
  • 解决常见的回归任务

监控性能

  • 评估和报告绩效
  • 提前停止

按重要性绘制特征

  • 计算特征重要性
  • 决定保留或丢弃哪些输入变数

配置梯度提升

  • 查看训练和验证数据集的学习曲线
  • 调整学习率
  • 调整树的数量

超参数优化

  • 提高 XGBoost 模型的性能
  • 设计受控实验以优化超参数
  • 搜索参数组合

创建 Pipeline

  • 将 XGBoost 模型整合到端到端机器学习管道中
  • 优化管道中的超参数
  • 高级预处理技术

故障排除

总结和结论

要求

  • 编写机器学习模型的经验

观众

  • 数据科学家
  • 机器学习工程师
 14 小时

人数


每位参与者的报价

即将举行的公开课程