课程大纲
模块1:核心Python用于ML工作流
• 课程启动与环境设置
明确目标,并设置可复现的Python ML工作环境
• Python语言基础(快速入门)
回顾ML代码库中常用的语法、控制流、函数和模式
• 用于ML的数据结构
列表、字典、集合和元组,用于特征、标签和元数据
• 推导式与函数式工具
使用推导式和高阶函数表达转换
• 面向对象的Python用于ML开发者
类、方法、组合和实用的设计决策
• dataclasses与轻量级建模
用于配置、示例和结果的类型化容器
• 装饰器与上下文管理器
计时、缓存、日志记录和资源安全执行模式
• 处理文件与路径
稳健的数据集处理与序列化格式
• 异常与防御性编程
编写安全且透明的ML脚本
• 模块、包与项目结构
组织可重用的ML代码库
• 类型与代码质量
类型提示、文档和lint友好的结构
模块2:数值Python、SciPy与数据处理
• NumPy基础:向量化计算
高效的数组操作与性能感知编码
• 索引、切片、广播与形状
安全的张量操作与形状推理
• 线性代数基础:NumPy与SciPy
ML中使用的稳定矩阵操作与分解
• SciPy深入探讨
统计、优化、曲线拟合与稀疏矩阵
• Pandas用于表格ML数据
数据清洗、连接、聚合与数据集准备
• scikit-learn深入探讨
估计器接口、管道与可复现的工作流
• 可视化基础
数据探索与模型行为的诊断图
模块3:构建ML应用的编程模式
• 从笔记本到可维护的项目
将探索性代码重构为结构化包
• 配置管理
外部化参数与启动验证
• 日志、警告与可观测性
结构化日志记录,用于可调试的ML系统
• 可复用组件:OOP与组合
设计可扩展的转换器与预测器
• 实用设计模式
管道、工厂或注册、策略与适配器模式
• 数据验证与模式检查
防止数据问题无声发生
• 性能与剖析
识别瓶颈并应用优化技术
• 模型I/O与推理接口
安全的持久化与干净的预测接口
• 端到端迷你构建
生产级ML管道,包含配置与日志记录
模块4:统计学习:表格、文本与图像
• 评估基础
训练与验证集划分,诚实交叉验证与业务对齐的指标
• 高级表格ML
正则化GLM、树集成与无泄漏预处理
• 校准与不确定性
Platt缩放、等渗回归、自举与保形预测
• 经典NLP方法
分词权衡、TF-IDF、线性模型与朴素贝叶斯
• 主题建模
LDA基础与实际限制
• 经典计算机视觉
HOG、PCA与基于特征的管道
• 错误分析
偏差检测、标签噪声与虚假相关性
• 动手实验
无泄漏表格管道
文本基线比较与解释
经典视觉基线,包含结构化失败分析
模块5:神经网络:表格、文本与图像
• 训练循环精通
干净的PyTorch循环,包含AMP、裁剪与可复现性
• 优化与正则化
初始化、归一化、优化器与调度器
• 混合精度与缩放
梯度累积与检查点策略
• 表格神经网络
类别嵌入、特征交叉与消融研究
• 文本神经网络
嵌入、CNN、BiLSTM或GRU与序列处理
• 视觉神经网络
CNN基础与ResNet风格架构
• 动手实验
可复用的训练框架
表格NN与提升算法比较
CNN,包含数据增强与调度实验
模块6:高级神经网络架构
• 迁移学习策略
冻结与解冻模式,判别学习率
• Transformer架构:文本
自注意力内部机制与微调方法
• 视觉骨干与密集预测
ResNet、EfficientNet、Vision Transformers与U-Net概念
• 高级表格架构
TabTransformer、FT-Transformer与深度交叉网络
• 时间序列考虑
时间划分与协变量漂移检测
• PEFT与效率技术
LoRA、蒸馏与量化权衡
• 动手实验
微调预训练文本Transformer
微调预训练视觉模型
表格Transformer与GBDT比较
模块7:生成式AI系统
• 提示基础
结构化提示与控制生成
• LLM基础
分词、指令微调与幻觉缓解
• 检索增强生成
分块、嵌入、混合搜索与评估指标
• 微调策略
LoRA与QLoRA,包含数据质量控制
• 扩散模型
潜在扩散直觉与实际适应
• 合成表格数据
CTGAN与隐私考虑
• 动手实验
生产级RAG迷你应用
结构化输出验证,包含模式强制执行
可选扩散实验
模块8:AI Agent与MCP
• Agent循环设计
观察、计划、执行、反思与持久化
• Agent架构
ReAct、计划-执行与多Agent协调
• 内存管理
情景、语义与便签方法
• 工具集成与安全
工具契约、沙盒与提示注入防御
• 评估框架
可重放跟踪、任务套件与回归测试
• MCP与协议互操作性
设计MCP服务器,包含安全工具暴露
• 动手实验
从零构建Agent
通过MCP风格服务器暴露工具
创建评估框架,包含安全约束
要求
学员应具备Python编程的工作知识。
本课程面向中级到高级技术专业人员。
客户评论 (2)
ML生态系统不仅包括MLFlow,还有Optuna、hyperops、docker、docker-compose
Guillaume GAUTIER - OLEA MEDICAL
课程 - MLflow
机器翻译
我参加了Kubeflow的远程培训,这次培训让我巩固了关于AWS服务、K8s以及围绕Kubeflow的所有DevOps工具的知识,这些都是正确应对该主题的必要基础。我想感谢Malawski Marcin的耐心和专业精神,他在培训和最佳实践建议方面做得非常出色。Malawski从不同角度探讨了该主题,使用了不同的部署工具,如Ansible、EKS kubectl和Terraform。现在,我完全确信自己正在进入正确的应用领域。
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
课程 - Kubeflow
机器翻译