课程大纲

DeepSeek LLM微调简介

  • DeepSeek模型概述,例如DeepSeek-R1和DeepSeek-V3
  • 理解微调LLM的必要性
  • 微调与提示工程的对比

准备微调数据集

  • 整理领域特定的数据集
  • 数据预处理和清理技术
  • DeepSeek LLM的标记化和数据集格式化

设置微调环境

  • 配置GPU和TPU加速
  • 设置Hugging Face Transformers与DeepSeek LLM
  • 理解微调的超参数

DeepSeek LLM微调

  • 实现监督微调
  • 使用LoRA(低秩适应)和PEFT(参数高效微调)
  • 运行分布式微调以处理大规模数据集

评估和优化微调模型

  • 使用评估指标评估模型性能
  • 处理过拟合和欠拟合
  • 优化推理速度和模型效率

部署微调的DeepSeek模型

  • 为API部署打包模型
  • 将微调模型集成到应用中
  • 使用云和边缘计算扩展部署

实际用例和应用

  • 微调LLM在金融、医疗和客户支持中的应用
  • 行业应用案例研究
  • 领域特定AI模型的伦理考量

总结与下一步

要求

  • 具备机器学习和深度学习框架的经验
  • 熟悉transformer和大语言模型(LLMs)
  • 理解数据预处理和模型训练技术

受众

  • 探索LLM微调的AI研究人员
  • 开发定制AI模型的机器学习工程师
  • 实现AI驱动解决方案的高级开发者
 21 小时

即将举行的公开课程

课程分类