课程大纲

QLoRA与量化技术介绍

  • 量化概述及其在模型优化中的作用
  • QLoRA框架介绍及其优势
  • QLoRA与传统微调方法的主要区别

大语言模型(LLMs)基础

  • LLMs介绍及其架构
  • 大规模微调大模型的挑战
  • 量化如何帮助克服LLM微调中的计算限制

使用QLoRA微调LLMs的实现

  • 设置QLoRA框架和环境
  • 准备用于QLoRA微调的数据集
  • 使用Python和PyTorch/TensorFlow逐步实现QLoRA微调LLMs

使用QLoRA优化微调性能

  • 如何通过量化平衡模型准确性和性能
  • 减少微调期间计算成本和内存占用的技术
  • 在有限硬件资源下进行微调的策略

评估微调模型

  • 如何评估微调模型的有效性
  • 语言模型的常见评估指标
  • 微调后优化模型性能及问题排查

部署和扩展微调模型

  • 将量化LLMs部署到生产环境的最佳实践
  • 扩展部署以处理实时请求
  • 用于模型部署和监控的工具与框架

实际应用案例与案例分析

  • 案例研究:为客户支持和NLP任务微调LLMs
  • 在医疗、金融、电子商务等行业微调LLMs的示例
  • 从QLoRA模型实际部署中吸取的经验教训

总结与下一步

要求

  • 对机器学习基础和神经网络的理解
  • 具备模型微调和迁移学习的经验
  • 熟悉大语言模型(LLMs)和深度学习框架(如PyTorch、TensorFlow)

受众

  • 机器学习工程师
  • AI开发人员
  • 数据科学家
 14 小时

即将举行的公开课程

课程分类