Large Language Models (LLMs) and Reinforcement Learning (RL) 培训
Large Language Models (LLMs) 是高级类型的神经网络,旨在根据接收到的输入来理解和生成类似人类的文本。Reinforcement Learning (RL) 是一种机器学习,其中代理通过在环境中执行操作来学习做出决策,以最大化累积奖励。
这种以讲师为主导的现场培训(在线或远程)面向希望全面了解 Large Language Models (LLMs) 和 Reinforcement Learning (RL) 的中级数据科学家。
在培训结束时,参与者将能够:
- 了解变压器模型的组件和功能。
- 针对特定任务和应用程序优化和微调 LLM。
- 了解强化学习的核心原则和方法。
- 了解强化学习技术如何提高 LLM 的性能。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- 如需申请本课程的定制培训,请联系我们进行安排。
课程大纲
Large Language Models (LLMs) 简介
- LLM概述
- 定义和意义
- 当今人工智能中的应用
变压器架构
- 什么是变压器,它是如何工作的?
- 主要组件和特点
- 嵌入和位置编码
- 多头注意力
- 前馈神经网络
- 归一化和残差连接
变压器型号
- 自注意力机制
- 编码器-解码器架构
- 位置嵌入
- BERT(来自 Transformer 的双向编码器表示)
- GPT(生成式预训练转换器)
性能优化和陷阱
- 上下文长度
- 曼巴和状态空间模型
- 闪光注意力
- 稀疏变压器
- 视觉变压器
- 量化的重要性
改进变压器
- 检索增强文本生成
- 模型混合
- 思想之树
微调
- 低秩适应理论
- 使用 QLora 进行微调
LLM 中的缩放定律和优化
- LLM扩展法的重要性
- 数据和模型大小缩放
- 计算扩展
- 参数效率缩放
优化
- 模型大小、数据大小、计算预算和推理需求之间的关系
- 优化 LLM 的性能和效率
- 用于训练和微调 LLM 的最佳实践和工具
训练和微调 LLM
- 从头开始培训 LLM 的步骤和挑战
- 数据采集与维护
- 大规模数据、CPU 和内存要求
- 优化挑战
- 开源 LLM 的前景
Reinforcement Learning (RL) 的基础知识
- Reinforcement Learning 简介
- 通过积极强化学习
- 定义和核心概念
- 马尔可夫决策过程 (MDP)
- 动态规划
- 蒙特卡罗方法
- 时差学习
深 Reinforcement Learning
- 深度 Q 网络 (DQN)
- 近端策略优化 (PPO)
- Element秒,共 Reinforcement Learning
LLM 和 Reinforcement Learning 的集成
- 将 LLM 与 Reinforcement Learning 相结合
- RL在LLM中的使用方式
- Reinforcement Learning 人工反馈 (RLHF)
- RLHF的替代品
案例研究和应用
- 实际应用
- 成功案例和挑战
高级主题
- 先进技术
- 高级优化方法
- 尖端研发
摘要和后续步骤
要求
- 基本了解 Machine Learning
观众
- 数据科学家
- 软件工程师
需要帮助选择合适的课程吗?
Large Language Models (LLMs) and Reinforcement Learning (RL) 培训 - Enquiry
Large Language Models (LLMs) and Reinforcement Learning (RL) - 问询
问询
即将举行的公开课程
相关课程
AI Automation with n8n and LangChain
14 小时这种以讲师为主导的><loc(在线或现场)实时培训面向希望在不编写大量代码的情况下使用 AI 自动化任务和流程的所有技能水平的开发人员和 IT 专业人员。
在培训结束时,参与者将能够:
- 使用 n8n 的可视化编程接口设计和实现复杂的工作流程。
- 使用 LangChain 将 AI 功能集成到工作流中。
- 为各种用例构建自定义聊天机器人和虚拟助手。
- 使用 AI 代理执行高级数据分析和处理。
Automating Workflows with LangChain and APIs
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向希望了解如何使用 LangChain 和 API 自动执行重复性任务和工作流的初级业务分析师和自动化工程师。
在本次培训结束时,参与者将能够:
- 了解与 LangChain 集成的 API 的基础知识。
- 使用 LangChain 和 Python 自动执行重复的工作流程。
- 利用 LangChain 连接各种 API 以实现高效的业务流程。
- 使用 API 和 LangChain 的自动化功能创建和自动化自定义工作流程。
Building Conversational Agents with LangChain
14 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望加深对对话代理的理解并将 LangChain 应用于实际用例的中级专业人员。
在本次培训结束时,参与者将能够:
- 了解 LangChain 的基础知识及其在构建对话代理中的应用。
- 使用 LangChain 开发和部署对话代理。
- 将对话代理与 API 和外部服务整合。
- 应用 Natural Language Processing (NLP) 技术来提高对话代理的性能。
Building Private AI Workflows with Ollama
14 小时这是由讲师指导的现场培训课程,适合在中国(线上或现场)参加的高阶专业人士,旨在使用Ollama实现安全且高效的人工智慧驱动工作流程。
在培训结束时,参与者将能够:
- 部署并配置Ollama以进行私有AI处理。
- 将AI模型整合到安全的企业工作流程中。
- 在保持数据隐私的同时优化AI性能。
- 利用本地AI功能自动化业务流程。
- 确保符合企业安全与治理政策。
Cross-Lingual LLMs
14 小时这种以讲师为主导的中国(在线或现场)现场培训面向中级 NLP 从业者和数据科学家、内容创建者和翻译人员,以及希望使用 LLM 进行语言翻译和创建多语言内容的全球企业。
在培训结束时,参与者将能够:
- 了解LLM跨语言学习和翻译的原则。
- 实现 LLM 以在各种语言之间翻译内容。
- 创建和管理用于训练 LLM 的多语言数据集。
- 制定保持翻译一致性和质量的策略。
Deploying and Optimizing LLMs with Ollama
14 小时这是一场由讲师指导的现场培训,地点在中国(线上或现场),适合希望使用Ollama部署、优化和整合LLM的中级专业人士。
在培训结束时,参与者将能够:
- 使用Ollama设置和部署LLM。
- 优化AI模型以提升性能和效率。
- 利用GPU加速提升推理速度。
- 将Ollama整合到工作流程和应用程式中。
- 监控和维护AI模型的长期性能。
Ethical Considerations in AI Development with LangChain
21 小时这种由讲师指导的现场培训在 中国(在线或现场)面向高级 AI 研究人员和政策制定者,他们希望探索 AI 开发的道德影响,并学习如何在构建 AI 解决方案时应用道德准则 LangChain。
在本次培训结束时,参与者将能够:
- 用 LangChain 识别 AI 开发中的关键道德问题。
- 了解 AI 对社会和决策过程的影响。
- 制定构建公平透明的 AI 系统的策略。
- 在基于 LangChain 的专案中实施合乎道德的 AI 准则。
Ethical Deployment of LLMs
7 小时这种以讲师为主导的中国(在线或现场)现场培训面向希望了解和驾驭 LLM 道德景观的中级 AI 专业人员和伦理学家、数据科学家和工程师,以及政策制定者和利益相关者。
在培训结束时,参与者将能够:
- 确定与 LLM 相关的道德问题和挑战。
- 将道德框架和原则应用于 LLM 部署。
- 评估 LLM 的社会影响并降低潜在风险。
- 制定负责任的人工智能开发和使用战略。
Enhancing User Experience with LangChain in Web Apps
14 小时这种由讲师指导的 中国 现场培训(在线或现场)面向希望利用 LangChain 创建直观且使用者友好的 Web 应用程式的中级 Web 开发人员和 UX 设计人员。
在本次培训结束时,参与者将能够:
- 了解 LangChain 的基本概念及其在增强 Web 用户体验中的作用。
- 在 Web 应用程式中实现 LangChain 以建立动态和回应式介面。
- 将 API 整合到 Web 应用程式中,以提高交互性和用户参与度。
- 使用 LangChain 的高级自定义功能优化用户体验。
- 分析使用者行为数据以微调 Web 应用程式性能和体验。
Fine-Tuning and Customizing AI Models on Ollama
14 小时这是一个由讲师指导的现场培训课程,可在中国(线上或现场)进行,旨在为高级专业人士提供微调和自订Ollama上的AI模型的能力,以提升性能和针对特定领域的应用。
在培训结束时,参与者将能够:
- 在Ollama上设置高效的AI模型微调环境。
- 为监督式微调和强化学习准备数据集。
- 优化AI模型以提升性能、准确性和效率。
- 在生产环境中部署自订模型。
- 评估模型改进并确保其稳健性。
LangChain: Building AI-Powered Applications
14 小时这种由讲师指导的中国(在线或现场)现场培训面向希望使用LangChain框架构建AI驱动的应用程序的中级开发人员和软件工程师。
在培训结束时,参与者将能够:
- 了解LangChain及其组件的基础知识。
- 将 LangChain 与 GPT-4 等大型语言模型 (LLM) 集成。
- 使用 LangChain 构建模块化 AI 应用程序。
- 排查LangChain应用程序中的常见问题。
Integrating LangChain with Cloud Services
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向高级数据工程师和 DevOps 专业人员,他们希望通过将 LangChain 的功能与各种云服务集成来利用 LangChain 的功能。
在本次培训结束时,参与者将能够:
- 与 AWS、Azure 和 Google Cloud 等主要云平台集成 LangChain。
- 利用基于云的 API 和服务来增强 LangChain 驱动的应用程式。
- 扩展对话代理并将其部署到云中,以实现即时交互。
- 在云环境中实施监控和安全最佳实践。
LangChain for Data Analysis and Visualization
14 小时这种讲师指导的 中国 现场培训(在线或现场)面向希望使用 LangChain 来增强其数据分析和可视化能力的中级数据专业人员。
在本次培训结束时,参与者将能够:
- 使用 LangChain 自动检索和清理数据。
- 使用 Python 和 LangChain 进行高级数据分析。
- 使用 Matplotlib 和其他与 LangChain 集成的 Python 库创建可视化。
- 利用 LangChain 从数据分析中生成自然语言洞察。
LangChain Fundamentals
14 小时这种以讲师为主导的中国(在线或现场)现场培训面向希望学习LangChain核心概念和架构并获得构建AI驱动应用程序的实用技能的初级到中级开发人员和软件工程师。
在培训结束时,参与者将能够:
- 掌握LangChain的基本原理。
- 设置和配置LangChain环境。
- 了解架构以及 LangChain 如何与大型语言模型 (LLM) 交互。
- 使用LangChain开发简单的应用程序。
Getting Started with Ollama: Running Local AI Models
7 小时这是一个由讲师指导的现场培训课程,可在中国(线上或现场)进行,适合初级专业人士学习如何在本地机器上安装、配置和使用 Ollama 来运行 AI 模型。
在本课程结束时,学员将能够:
- 了解 Ollama 的基本概念及其功能。
- 设置 Ollama 以运行本地 AI 模型。
- 使用 Ollama 部署并与 LLM 进行互动。
- 优化 AI 工作负载的性能和资源使用。
- 探索本地 AI 部署在各行业中的应用案例。