课程大纲

QLoRA与量化简介

  • 量化概述及其在模型优化中的作用
  • QLoRA框架介绍及其优势
  • QLoRA与传统微调方法的关键差异

Large Language Models (LLMs)基础知识

  • LLM简介及其架构
  • 大规模微调大型模型的挑战
  • 量化如何帮助克服LLM微调中的计算限制

为Fine-Tuning LLM实施QLoRA

  • 设置QLoRA框架和环境
  • 准备用于QLoRA微调的数据集
  • 使用Python和PyTorch/TensorFlow在LLM上实施QLoRA的逐步指南

使用QLoRA优化Fine-Tuning性能

  • 如何平衡模型准确性和量化性能
  • 在微调期间减少计算成本和内存使用的技术
  • 使用最低硬件需求进行微调的策略

评估微调模型

  • 如何评估微调模型的有效性
  • 语言模型的常见评估指标
  • 微调后优化模型性能并解决问题

部署和扩展微调模型

  • 将量化LLM部署到生产环境的最佳实践
  • 扩展部署以处理实时请求
  • 用于模型部署和监控的工具和框架

实际Use Case和案例研究

  • 案例研究:为客户支持和NLP任务微调LLM
  • 在医疗、金融和电子商务等行业中微调LLM的示例
  • 从实际部署QLoRA模型中学到的经验教训

总结与下一步

要求

  • 了解机器学习基础知识和神经网路
  • 具备模型微调和迁移学习的经验
  • 熟悉大型语言模型(LLMs)和深度学习框架(例如PyTorch, TensorFlow)

目标受众

  • 机器学习工程师
  • AI开发人员
  • 数据科学家
 14 小时

即将举行的公开课程

课程分类