Large Language Models (LLMs) and Reinforcement Learning (RL) 培训
Large Language Models (LLMs) 是高级类型的神经网络,旨在根据接收到的输入来理解和生成类似人类的文本。Reinforcement Learning (RL) 是一种机器学习,其中代理通过在环境中执行操作来学习做出决策,以最大化累积奖励。
这种以讲师为主导的现场培训(在线或远程)面向希望全面了解 Large Language Models (LLMs) 和 Reinforcement Learning (RL) 的中级数据科学家。
在培训结束时,参与者将能够:
- 了解变压器模型的组件和功能。
- 针对特定任务和应用程序优化和微调 LLM。
- 了解强化学习的核心原则和方法。
- 了解强化学习技术如何提高 LLM 的性能。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在现场实验室环境中动手实施。
课程自定义选项
- 如需申请本课程的定制培训,请联系我们进行安排。
课程大纲
Large Language Models (LLMs) 简介
- LLM概述
- 定义和意义
- 当今人工智能中的应用
变压器架构
- 什么是变压器,它是如何工作的?
- 主要组件和特点
- 嵌入和位置编码
- 多头注意力
- 前馈神经网络
- 归一化和残差连接
变压器型号
- 自注意力机制
- 编码器-解码器架构
- 位置嵌入
- BERT(来自 Transformer 的双向编码器表示)
- GPT(生成式预训练转换器)
性能优化和陷阱
- 上下文长度
- 曼巴和状态空间模型
- 闪光注意力
- 稀疏变压器
- 视觉变压器
- 量化的重要性
改进变压器
- 检索增强文本生成
- 模型混合
- 思想之树
微调
- 低秩适应理论
- 使用 QLora 进行微调
LLM 中的缩放定律和优化
- LLM扩展法的重要性
- 数据和模型大小缩放
- 计算扩展
- 参数效率缩放
优化
- 模型大小、数据大小、计算预算和推理需求之间的关系
- 优化 LLM 的性能和效率
- 用于训练和微调 LLM 的最佳实践和工具
训练和微调 LLM
- 从头开始培训 LLM 的步骤和挑战
- 数据采集与维护
- 大规模数据、CPU 和内存要求
- 优化挑战
- 开源 LLM 的前景
Reinforcement Learning (RL) 的基础知识
- Reinforcement Learning 简介
- 通过积极强化学习
- 定义和核心概念
- 马尔可夫决策过程 (MDP)
- 动态规划
- 蒙特卡罗方法
- 时差学习
深 Reinforcement Learning
- 深度 Q 网络 (DQN)
- 近端策略优化 (PPO)
- Element秒,共 Reinforcement Learning
LLM 和 Reinforcement Learning 的集成
- 将 LLM 与 Reinforcement Learning 相结合
- RL在LLM中的使用方式
- Reinforcement Learning 人工反馈 (RLHF)
- RLHF的替代品
案例研究和应用
- 实际应用
- 成功案例和挑战
高级主题
- 先进技术
- 高级优化方法
- 尖端研发
摘要和后续步骤
要求
- 基本了解 Machine Learning
观众
- 数据科学家
- 软件工程师
需要帮助选择合适的课程吗?
Large Language Models (LLMs) and Reinforcement Learning (RL) 培训 - Enquiry
Large Language Models (LLMs) and Reinforcement Learning (RL) - 问询
问询
即将举行的公开课程
相关课程
Building Private AI Workflows with Ollama
14 小时这是由讲师指导的现场培训课程,适合在中国(线上或现场)参加的高阶专业人士,旨在使用Ollama实现安全且高效的人工智慧驱动工作流程。
在培训结束时,参与者将能够:
- 部署并配置Ollama以进行私有AI处理。
- 将AI模型整合到安全的企业工作流程中。
- 在保持数据隐私的同时优化AI性能。
- 利用本地AI功能自动化业务流程。
- 确保符合企业安全与治理政策。
Claude AI for Content Creation
14 小时这门由教师主导的现场培训课程面向初学者到中级内容创作者、编辑和营销人员,旨在教他们利用 Claude AI 进行内容生成、编辑和总结,以增强博客、报告和营销材料。
培训结束时,参与者将能够:
- 使用 Claude AI 进行内容头脑风暴和想法扩展。
- 通过 AI 助理编辑和校对来增强写作。
- 为长格式内容和报告生成总结。
- 为不同平台自动化营销副本创建。
Claude AI for Developers: Building AI-Powered Applications
14 小时这个面向希望将Claude AI集成到他们的应用程序中、构建AI驱动的聊天机器人以及通过AI驱动的自动化来增强软件功能的中级软件开发人员和AI工程师的中国(在线或现场) Instructor-led, live training (online or onsite)。
在这次培训结束时,参与者将能够:
- 使用Claude AI API将AI集成到应用程序中。
- 开发AI驱动的聊天机器人和虚拟助手。
- 利用AI驱动的自动化和NLP增强应用程序。
- 对不同的用例优化和微调Claude AI模型。
Claude AI for Research and Knowledge Management
14 小时这项在中国(线上或现场)进行的由讲师主导的现场培训,旨在帮助中级研究人员、分析师和知识工作者利用Claude AI处理大量数据、综合信息和自动化研究任务。
培训结束时,参与者将能够:
- 利用Claude AI进行文献回顾和研究综合。
- 总结报告、研究论文和长格式文档。
- 从结构化和非结构化数据中提取关键洞察和趋势。
- 将Claude AI集成到研究和知识管理工作流程中。
Claude AI for Workflow Automation and Productivity
14 小时这门由讲师主导的现场培训在中国(在线或现场)旨在帮助有志于将Claude AI整合到日常工作流程中以提高效率和自动化的初级专业人员。
培训结束时,参加者将能够:
- 利用Claude AI来自动化重复性任务和精简工作流程。
- 利用人工智慧驱动的自动化技术提高个人和团队的生产力。
- 将Claude AI与现有的商业工具和平台整合。
- 优化AI驱动的决策制定和任务管理。
Deploying and Optimizing LLMs with Ollama
14 小时这是一场由讲师指导的现场培训,地点在中国(线上或现场),适合希望使用Ollama部署、优化和整合LLM的中级专业人士。
在培训结束时,参与者将能够:
- 使用Ollama设置和部署LLM。
- 优化AI模型以提升性能和效率。
- 利用GPU加速提升推理速度。
- 将Ollama整合到工作流程和应用程式中。
- 监控和维护AI模型的长期性能。
Fine-Tuning and Customizing AI Models on Ollama
14 小时这是一个由讲师指导的现场培训课程,可在中国(线上或现场)进行,旨在为高级专业人士提供微调和自订Ollama上的AI模型的能力,以提升性能和针对特定领域的应用。
在培训结束时,参与者将能够:
- 在Ollama上设置高效的AI模型微调环境。
- 为监督式微调和强化学习准备数据集。
- 优化AI模型以提升性能、准确性和效率。
- 在生产环境中部署自订模型。
- 评估模型改进并确保其稳健性。
Introduction to Google Gemini AI
14 小时这种以讲师为主导的中国(在线或现场)实时培训面向希望使用 Google Gemini AI 将 AI 功能集成到其应用程序中的初级到中级开发人员。
在培训结束时,参与者将能够:
- 了解大型语言模型的基础知识。
- 设置和使用 Google Gemini AI 执行各种 AI 任务。
- 实现文本到文本和图像到文本的转换。
- 构建基本的 AI 驱动型应用程序。
- 探索 Google Gemini AI 中的高级功能和自定义选项。
Google Gemini AI for Content Creation
14 小时这种以讲师为主导的中国(在线或现场)现场培训面向希望利用 Google Gemini AI 来提高其内容质量和效率的中级内容创作者。
在培训结束时,参与者将能够:
- 了解 AI 在内容创作中的作用。
- 设置和使用 Google Gemini AI 来生成和优化内容。
- 应用文本到文本的转换来生成创意和原创内容。
- 使用 AI 驱动的见解实施 SEO 策略。
- 使用 Gemini AI 分析内容性能并调整策略。
Google Gemini AI for Transformative Customer Service
14 小时这种以讲师为主导的中国(在线或现场)现场培训面向希望在客户服务运营中实施 Go ogle Gemini AI 的中级客户服务专业人员。
在培训结束时,参与者将能够:
- 了解 AI 对客户服务的影响。
- 设置 Google Gemini AI 以自动化和个性化客户交互。
- 利用文本到文本和图像到文本的转换来提高服务效率。
- 制定 AI 驱动的策略,用于实时客户反馈分析。
- 探索高级功能,打造无缝的客户服务体验。
Google Gemini AI for Data Analysis
21 小时这种以讲师为主导的中国(在线或现场)现场培训面向希望使用 Google Gemini AI 在各个行业更直观地执行复杂数据分析任务的初级到中级数据分析师和业务专业人员。
在培训结束时,参与者将能够:
- 了解 Google Gemini AI 的基础知识。
- 将各种数据源连接到 Gemini AI。
- 使用自然语言查询浏览数据。
- 分析数据模式并得出见解。
- 创建引人入胜的数据可视化。
- 有效地传达数据驱动的见解。
Intermediate Gemini AI for Public Sector Professionals
16 小时这是由讲师指导的中国(线上或线下)培训,针对中级水平的公共部门专业人士,旨在通过更先进的AI互动,使用Gemini生成高质量内容、协助研究并提高生产力。
在培训结束时,参与者将能够:
- 为特定用例制作更有效和量身定制的提示。
- 使用Gemini生成原创和创意的内容。
- 精确地总结和比较复杂的信息。
- 使用Gemini进行头脑风暴、计划和高效组织想法。
Introduction to Claude AI: Conversational AI and Business Applications
14 小时这项由讲师主持的现场培训(在线或现场)旨在帮助希望了解Claude AI的基本原理并利用它进行商业应用的初级商业专业人士、客户支持团队和技术爱好者。
培训结束时,参与者将能够:
- 了解Claude AI的能力和用例。
- 有效地设置和与Claude AI互动。
- 利用对话式AI自动化业务工作流程。
- 利用AI驱动的解决方案提升客户互动和支持。
LangChain: Building AI-Powered Applications
14 小时这种由讲师指导的中国(在线或现场)现场培训面向希望使用LangChain框架构建AI驱动的应用程序的中级开发人员和软件工程师。
在培训结束时,参与者将能够:
- 了解LangChain及其组件的基础知识。
- 将 LangChain 与 GPT-4 等大型语言模型 (LLM) 集成。
- 使用 LangChain 构建模块化 AI 应用程序。
- 排查LangChain应用程序中的常见问题。
Getting Started with Ollama: Running Local AI Models
7 小时这是一个由讲师指导的现场培训课程,可在中国(线上或现场)进行,适合初级专业人士学习如何在本地机器上安装、配置和使用 Ollama 来运行 AI 模型。
在本课程结束时,学员将能够:
- 了解 Ollama 的基本概念及其功能。
- 设置 Ollama 以运行本地 AI 模型。
- 使用 Ollama 部署并与 LLM 进行互动。
- 优化 AI 工作负载的性能和资源使用。
- 探索本地 AI 部署在各行业中的应用案例。