课程大纲

Cursor 在数据与机器学习工作流程中的介绍

  • Cursor 在数据与机器学习工程中的角色概述。
  • 环境设置与数据源连接。
  • 理解笔记本中的 AI 辅助代码功能。

加速笔记本开发

  • 在 Cursor 中创建和管理 Jupyter 笔记本。
  • 使用 AI 进行代码补全、数据探索和可视化。
  • 记录实验并保持可重复性。

构建 ETL 与特征工程管道

  • 使用 AI 生成和重构 ETL 脚本。
  • 构建可扩展的特征工程管道。
  • 版本控制管道组件和数据集。

使用 Cursor 进行模型训练与评估

  • 构建模型训练代码和评估循环。
  • 集成数据预处理和超参数调优。
  • 确保模型在不同环境中的可重复性。

将 Cursor 集成到 MLOps 管道中

  • 将 Cursor 连接到模型注册表和 CI/CD 工作流程。
  • 使用 AI 辅助脚本进行自动化重新训练和部署。
  • 监控模型生命周期和版本跟踪。

AI 辅助文档与报告

  • 为数据管道生成内联文档。
  • 创建实验总结和进度报告。
  • 通过上下文链接文档提升团队协作。

机器学习项目中的可重复性与治理

  • 实施数据与模型溯源的最佳实践。
  • 维护 AI 生成代码的治理与合规性。
  • 审核 AI 决策并保持可追溯性。

优化生产力与未来应用

  • 应用提示策略以加快迭代速度。
  • 探索数据操作中的自动化机会。
  • 为未来 Cursor 与机器学习集成的发展做好准备。

总结与下一步

要求

  • 具备基于 Python 的数据分析或机器学习经验。
  • 了解 ETL 和模型训练工作流程。
  • 熟悉版本控制和数据管道工具。

目标学员

  • 构建和迭代机器学习笔记本的数据科学家。
  • 设计训练和推理管道的机器学习工程师。
  • 管理模型部署和可重复性的 MLOps 专业人士。
 14 小时

即将举行的公开课程

课程分类