课程大纲

介绍与环境设置

  • AutoML是什么及其重要性
  • 设置Python和R环境
  • 配置远程桌面和云环境

探索AutoML功能

  • AutoML框架的核心功能
  • 超参数优化与搜索策略
  • 解释AutoML输出与日志

AutoML如何选择算法

  • 梯度提升机(GBMs)、随机森林、广义线性模型(GLMs)
  • 神经网络与深度学习后端
  • 权衡:准确性 vs. 可解释性 vs. 成本

数据准备与预处理

  • 处理数值与分类数据
  • 特征工程与编码策略
  • 处理缺失值与数据不平衡

针对不同数据类型的AutoML

  • 表格数据(H2O AutoML、auto-sklearn、TPOT)
  • 时间序列数据(预测与序列建模)
  • 文本与自然语言处理任务(分类、情感分析)
  • 图像分类与计算机视觉(Auto-Keras、TensorFlow、PyTorch)

模型部署与监控

  • 导出与部署AutoML模型
  • 构建实时预测管道
  • 监控模型漂移与重新训练策略

集成与高级主题

  • 堆叠与混合AutoML模型
  • 隐私与合规考虑
  • 大规模AutoML的成本优化

故障排除与案例研究

  • 常见错误及其解决方法
  • 解释AutoML模型性能
  • 行业用例的案例研究

总结与下一步

要求

  • 具备机器学习算法经验
  • 具备Python或R编程经验

受众

  • 数据分析师
  • 数据科学家
  • 数据工程师
  • 开发人员
 14 小时

即将举行的公开课程

课程分类