预训练模型简介 培训
预训练模型是现代 AI 的基石,提供可适应各种应用的预构建功能。本课程向参与者介绍预训练模型的基础知识、架构和实际用例。参与者将学习如何利用这些模型完成文本分类、图像识别等任务。
这种由讲师指导的现场培训(在线或现场)面向初级专业人员,他们希望了解预训练模型的概念,并学习如何应用它们来解决实际问题,而无需从头开始构建模型。
在本次培训结束时,参与者将能够:
- 了解预训练模型的概念和优势。
- 探索各种预先训练的模型架构及其使用案例。
- 针对特定任务微调预先训练的模型。
- 在简单的机器学习项目中实施预训练模型。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在即时实验室环境中动手实施。
课程自定义选项
- 要申请本课程的定制培训,请联系我们进行安排。
课程大纲
Introduction to Pre-trained Models
- 什么是预训练模型?
- 使用预训练模型的好处
- 流行的预训练模型(例如 BERT、ResNet)概述
了解预训练模型架构
- 模型架构基础知识
- 迁移学习和微调概念
- 如何构建和训练预训练模型
设置环境
- 安装和配置 Python 和相关库
- 探索预先训练的模型存储库(例如 Hugging Face)
- 载入和测试预训练模型
动手操作预训练模型
- 使用预先训练的模型进行文本分类
- 将预训练模型应用于图像识别任务
- 为自订数据集微调预训练模型
部署预训练模型
- 汇出和保存微调模型
- 将模型整合到应用程式中
- 在生产环境中部署模型的基础知识
挑战和最佳实践
- 了解模型限制
- 在微调过程中避免过拟合
- 确保合乎道德地使用 AI 模型
预训练模型的未来趋势
- 新兴架构及其应用
- 迁移学习的进步
- 探索大型语言模型和多模态模型
总结和后续步骤
要求
- 对机器学习概念的基本理解
- 熟悉 Python 程式设计
- 使用库进行数据处理的基本知识,如 Pandas
观众
- 数据科学家
- 人工智慧爱好者
需要帮助选择合适的课程吗?
预训练模型简介 培训 - 询价
即将举行的公开课程
相关课程
用于机器学习的 AdaBoost Python
14 小时本课程为讲师指导的中国(线上或线下)培训,面向希望使用AdaBoost构建Python机器学习算法的数据科学家和软件工程师。
在本培训结束时,学员将能够:
- 搭建必要的开发环境,开始使用AdaBoost构建机器学习模型。
- 理解集成学习方法,并掌握如何实现自适应提升。
- 学习如何使用AdaBoost模型提升Python中的机器学习算法。
- 通过超参数调优提高AdaBoost模型的准确性和性能。
Anaconda 数据科学家生态系统
14 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望使用 Anaconda 生态系统在单一平台中捕获、管理和部署软体包和数据分析工作流 的数据科学家。
在本次培训结束时,参与者将能够:
- 安装和配置 Anaconda 个元件和库。
- 了解 Anaconda 的核心概念、功能和优势。
- 使用 Anaconda Navigator 管理包、环境和频道。
- 将 Conda、R 和 Python 包用于数据科学和机器学习。
- 了解管理多个数据环境的一些实际使用案例和技术。
AutoML 与 Auto-Keras
14 小时这种由 中国 的讲师指导式现场培训(在线或现场)面向数据科学家以及希望使用 Auto-Keras 来自动化选择和优化机器学习模型过程的技术人员。
在本次培训结束时,参与者将能够:
- 自动执行高效机器学习模型的训练过程。
- 自动搜索深度学习模型的最佳参数。
- 构建高度准确的机器学习模型。
- 利用机器学习的强大功能解决实际业务问题。
使用Google AutoML创建自定义聊天机器人
14 小时这种以讲师为主导的中国(在线或现场)现场培训面向具有不同专业水平的参与者,他们希望利用 Google 的 AutoML 平台为各种应用程序构建定制的聊天机器人。
在培训结束时,参与者将能够:
- 了解聊天机器人开发的基础知识。
- 浏览 Google 云平台并访问 AutoML。
- 为训练聊天机器人模型准备数据。
- 使用 AutoML 训练和评估自定义聊天机器人模型。
- 将聊天机器人部署并集成到各种平台和渠道中。
- 随时间推移监控和优化聊天机器人性能。
Pattern Recognition
21 小时这门由讲师指导的中国(线上或线下)培训课程,介绍了模式识别和机器学习的领域,并涵盖了统计学、计算机科学、信号处理、计算机视觉、数据挖掘和生物信息学中的实际应用。
通过本培训,参与者将能够:
- 应用核心统计方法于模式识别。
- 使用神经网络和核方法等关键模型进行数据分析。
- 实施高级技术以解决复杂问题。
- 通过结合不同模型来提高预测准确性。
DataRobot
7 小时这种由 讲师指导的 中国 现场培训(在线或现场)面向希望使用 DataRobot 的机器学习功能自动化、评估和管理预测模型的数据科学家和数据分析师。
在本次培训结束时,参与者将能够:
- 在 DataRobot 中载入数据集以分析、评估和品质检查数据。
- 构建和训练模型以识别重要变数并满足预测目标。
- 解释模型以创建有助于做出业务决策的宝贵见解。
- 监控和管理模型以保持优化的预测性能。
Google Cloud AutoML
7 小时这种讲师指导的 中国 现场培训(在线或现场)面向数据科学家、数据分析师和开发人员,他们希望探索 AutoML 产品和功能,以最少的工作量创建和部署自定义 ML 训练模型。
在本次培训结束时,参与者将能够:
- 探索 AutoML 产品线,为各种数据类型实施不同的服务。
- 准备和标记数据集以创建自定义 ML 模型。
- 训练和管理模型以生成准确、公平的机器学习模型。
- 使用经过训练的模型进行预测,以满足业务目标和需求。
Kaggle
14 小时这个由 讲师指导的 中国 现场培训(在线或现场)面向希望在 Data Science 中使用 Kaggle 学习和建立职业生涯的数据科学家和开发人员。
在本次培训结束时,参与者将能够:
- 了解数据科学和机器学习。
- 探索数据分析。
- 了解 Kaggle 及其工作原理。
使用Google ML Kit进行移动apps的机器学习
14 小时本课程为讲师指导的(线上或线下)培训,面向希望使用Google的ML Kit构建专为移动设备优化的机器学习模型的开发者。
培训结束后,学员将能够:
- 设置必要的开发环境,开始为移动apps开发机器学习功能。
- 使用ML Kit API将新的机器学习技术集成到Android和iOS apps中。
- 使用ML Kit SDK增强和优化现有apps,进行设备端处理和部署。
使用Modin加速Python Pandas工作流
14 小时这种由 讲师指导的 中国 现场现场培训(在线或现场)面向希望使用 Modin 构建和实施并行计算的数据科学家和开发人员 Pandas 以加快数据分析速度。
在本次培训结束时,参与者将能够:
- 设置必要的环境,开始使用 Modin 大规模开发 Pandas 工作流。
- 了解 Modin 的功能、架构和优势。
- 了解 Modin、Dask 和 Ray 之间的区别。
- 使用 Modin 更快地执行 Pandas 操作。
- 实现整个 Pandas API 和函数。
机器学习与随机森林
14 小时本次由讲师指导的中国(线上或线下)培训面向希望使用随机森林构建机器学习算法以处理大型数据集的数据科学家和软件工程师。
在培训结束时,学员将能够:
- 设置必要的开发环境,开始使用随机森林构建机器学习模型。
- 了解随机森林的优势,以及如何用它解决分类和回归问题。
- 学习如何处理大型数据集,并解释随机森林中的多个决策树。
- 通过调整超参数来评估和优化机器学习模型的性能。
高级分析使用RapidMiner
14 小时此讲师指导的 中国 现场培训(在线或现场)面向 希望学习如何使用 RapidMiner 估计和预测值并利用分析工具进行时间序列预测的中级数据分析师。
在本次培训结束时,参与者将能够:
- 学习应用 CRISP-DM 方法,选择合适的机器学习演算法,并增强模型构建和性能。
- 使用 RapidMiner 估计和预测值,并利用分析工具进行时间序列预测。
RapidMiner 用于机器学习和预测分析
14 小时RapidMiner 是一个开源数据科学软体平台,用于快速应用程式原型设计和开发。它包括用于数据准备、机器学习、深度学习、文本挖掘和预测分析的集成环境。
在这个由讲师指导的实时培训中,参与者将学习如何使用 RapidMiner Studio 进行数据准备、机器学习和预测模型部署。
在本次培训结束时,参与者将能够:
- 安装与设定RapidMiner
- 使用 RapidMiner 准备和可视化数据
- 验证机器学习模型
- 混搭数据并创建预测模型
- 在业务流程中实施预测分析
- 故障排除和优化 RapidMiner
观众
- 数据科学家
- 工程师
- 开发人员
课程形式
- 部分讲座、部分讨论、练习和大量动手实践
注意
- 要申请本课程的定制培训,请联系我们进行安排。
GPU数据科学之NVIDIA RAPIDS
14 小时本次由讲师指导的线下或线上培训,面向希望使用RAPIDS构建GPU加速的数据管道、工作流和可视化的数据科学家和开发者,应用如XGBoost、cuML等机器学习算法。
培训结束后,参与者将能够:
- 设置必要的开发环境,使用NVIDIA RAPIDS构建数据模型。
- 了解RAPIDS的特性、组件和优势。
- 利用GPU加速端到端的数据和分析管道。
- 使用cuDF和Apache Arrow实现GPU加速的数据准备和ETL。
- 学习如何使用XGBoost和cuML算法执行机器学习任务。
- 使用cuXfilter和cuGraph构建数据可视化并执行图分析。