课程大纲

介绍

  • 什么是 Large Language Models (LLMs)?
  • LLM 与传统 NLP 模型
  • LLM 功能和体系结构概述
  • LLM的挑战和局限性

了解 LLM

  • 法学硕士的生命周期
  • LLM 的工作原理
  • LLM 的主要组件:编码器、解码器、注意力、嵌入等。

开始

  • 设置开发环境
  • 安装LLM作为开发工具,例如Google Colab,Hugging Face

使用 LLM

  • 探索可用的 LLM 选项
  • 创建和使用 LLM
  • 在自定义数据集上微调 LLM

文本摘要

  • 了解文本摘要的任务及其应用
  • 使用 LLM 进行提取和抽象文本摘要
  • 使用 ROUGE、BLEU 等指标评估生成的摘要的质量。

问答

  • 了解问答的任务及其应用
  • 使用 LLM 进行开放域和封闭域问答
  • 使用 F1、EM 等指标评估生成答案的准确性。

文本生成

  • 了解文本生成的任务及其应用
  • 使用 LLM 生成条件和无条件文本
  • 使用温度、top-k、top-p 等参数控制生成文本的样式、语气和内容。

将 LLM 与其他框架和平台集成

  • 在 PyTorch 或 TensorFlow 中使用 LLM
  • 将 LLM 与 Flask 或 Streamlit 一起使用
  • 将 LLM 与 Google Cloud 或 AWS 结合使用

故障 排除

  • 了解 LLM 中的常见错误和错误
  • 使用 TensorBoard 监控和可视化训练过程
  • 使用 PyTorch Lightning 简化训练代码并提高性能
  • 使用 Hugging Face Datasets 加载和预处理数据

摘要和后续步骤

要求

    对自然语言处理和深度学习的理解 具有 Python 和 PyTorch 或 TensorFlow 的经验 基本编程经验

观众

    开发 人员 NLP爱好者 数据科学家
 14 小时

人数



每位参与者的报价

相关课程

LangChain: Building AI-Powered Applications

14 小时

LangChain Fundamentals

14 小时

Advanced Stable Diffusion: Deep Learning for Text-to-Image Generation

21 小时

Introduction to Stable Diffusion for Text-to-Image Generation

21 小时

AlphaFold

7 小时

TensorFlow Lite for Embedded Linux

21 小时

TensorFlow Lite for Android

21 小时

TensorFlow Lite for iOS

21 小时

Tensorflow Lite for Microcontrollers

21 小时

Deep Learning Neural Networks with Chainer

14 小时

Distributed Deep Learning with Horovod

7 小时

Accelerating Deep Learning with FPGA and OpenVINO

35 小时

Building Deep Learning Models with Apache MXNet

21 小时

Deep Learning with Keras

21 小时

Advanced Deep Learning with Keras and Python

14 小时

课程分类