课程大纲

优化大型模型简介

  • 大型模型体系结构概述
  • 微调大型模型的挑战
  • 成本效益优化的重要性

分散式训练技术

  • 数据和模型并行性简介
  • 分散式训练框架:PyTorch 和 TensorFlow
  • 跨多个 GPU 和节点扩展

模型量化和修剪

  • 了解量化技术
  • 应用修剪以减小模型大小
  • 准确性和效率之间的权衡

硬体优化

  • 为微调任务选择合适的硬体
  • 优化 GPU 和 TPU 利用率
  • 对大型模型使用专用加速器

高效 Data Management

  • 管理大型数据集的策略
  • 性能的预处理和批处理
  • 数据增强技术

部署优化的模型

  • 部署微调模型的技术
  • 监控和维护模型性能
  • 优化模型部署的真实示例

高级优化技术

  • 探索低秩适应 (LoRA)
  • 使用适配器进行模组化微调
  • 模型优化的未来趋势

总结和后续步骤

要求

  • 使用 PyTorch 或 TensorFlow 等深度学习框架的经验
  • 熟悉大型语言模型及其应用程式
  • 了解分散式计算概念

观众

  • 机器学习工程师
  • 云 AI 专家
 21 小时

即将举行的公开课程

课程分类