Data Mining & Machine Learning with R 培训
R 是一种用于统计计算、数据分析和图形的开源免费编程语言。R 被越来越多的公司和学术界的经理和数据分析师使用。R 具有多种用于数据挖掘的包。
课程大纲
数据挖掘简介和 Machine Learning
- 统计学习与机器学习
- 迭代和评估
- 偏差-方差权衡
回归
- 线性回归
- 泛化和非线性
- 习题
分类
- 贝叶斯复习
- 朴素贝叶斯
- 二元分析
- 逻辑回归
- K-最近邻
- 支持向量机
- 神经网络
- 决策树
- 习题
交叉验证和重采样
- 交叉验证方法
- Bootstrap
- 习题
无监督学习
- K 均值聚类
- 例子
- 无监督学习和超越 K 均值的挑战
高级主题
- 集成模型
- 混合模型
- 提高
- 例子
多维还原
- 影响因子
- 主成分分析
- 例子
要求
本课程是数据科学家技能集(领域: 分析技术和方法)的一部分
需要帮助选择合适的课程吗?
Data Mining & Machine Learning with R 培训 - Enquiry
Data Mining & Machine Learning with R - 问询
问询
客户评论 (1)
The trainer was so knowledgeable and included areas I was interested in.
Mohamed Salama
课程 - Data Mining & Machine Learning with R
即将举行的公开课程
相关课程
Cluster Analysis with R and SAS
14 小时这种以讲师为主导的中国现场现场培训针对的是希望在SAS中使用R进行编程以进行聚类分析的数据分析师。
在培训结束时,参与者将能够:
- 使用聚类分析进行数据挖掘
- 群集解决方案的 Master R 语法。
- 实现分层和非分层聚类。
- 做出数据驱动的决策,帮助改善业务运营。
From Data to Decision with Big Data and Predictive Analytics
21 小时听众
如果您试图理解您可以访问或想要分析网络上可用的非结构化数据(如Twitter,链接等等),那么本课程适合您。
它主要针对需要选择哪些数据值得收集以及值得分析的决策者和人员。
它不是针对人们配置解决方案,但这些人将从大局中受益。
交货方式
在课程期间,代表们将获得大多数开源技术的工作示例。
讲座后将进行简短的讲座,参加者将进行简单的练习
使用的内容和软件
每次运行课程时都会更新所有使用的软件,因此我们会检查最新版本。
它涵盖了从获取,格式化,处理和分析数据的过程,以解释如何使用机器学习自动化决策制定过程。
Data Mining with Python
14 小时这种由讲师指导的现场培训(现场或远程)针对希望使用Python实现数据挖掘的更高级数据分析技术的数据分析师和数据科学家。
在培训结束时,参与者将能够:
- 了解数据挖掘的重要领域,包括关联规则挖掘、文本情感分析、自动文本摘要和数据异常检测。
- 比较并实施各种解决现实世界数据挖掘问题的策略。
- 理解并解释结果。
课程格式
- 互动式讲座和讨论。
- 大量练习和实践。
- 在实时实验室环境中进行动手实作。
课程自定义选项
- 如需为本课程安排自定义培训,请联系我们进行安排。
Data Mining with R
14 小时R是一种用于统计计算,数据分析和图形的开源免费编程语言。 R被企业和学术界内越来越多的经理和数据分析师使用。 R有各种各样的数据挖掘包。
Data Vault:构建可扩展的数据仓库
28 小时在这个由 中国 讲师指导的现场培训中,参与者将学习如何构建 Data Vault。
在本次培训结束时,参与者将能够:
- 了解 Data Vault 2.0 背后的架构和设计概念,以及它与 Big Data、NoSQL 和 AI 的交互。
- 使用数据保险库技术对数据仓库中的历史数据进行审计、跟踪和检查。
- 开发一致且可重复的 ETL(提取、转换、载入)流程。
- 构建和部署高度可扩展且可重复的仓库。
Data Visualization
28 小时本课程面向从事数据挖掘和知识发现工作的工程师和决策者。
您将学习如何创建有效的图表以及以一种吸引决策者并帮助他们理解隐藏信息的方式呈现和表示您的数据的方法。
Data Mining with Excel
14 小时这种以讲师为主导的中国现场培训(现场或远程)针对希望使用Excel进行数据挖掘的数据科学家。
- 在培训结束时,参与者将能够:
- 使用 Excel 浏览数据以执行数据挖掘和分析。
- 使用 Microsoft 算法进行数据挖掘。
- 了解 Excel 数据挖掘中的概念。
Data Mining with Weka
14 小时此讲师指导的 中国 现场培训(在线或现场)面向希望使用 Weka 执行数据挖掘任务的初级到 中级数据分析师和数据科学家。
在本次培训结束时,参与者将能够:
- 安装并配置 Weka。
- 了解 Weka 环境和工作台。
- 使用 Weka 执行数据挖掘任务。
Data Science for Big Data Analytics
35 小时大数据是如此庞大和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新和信息隐私。
Foundation R
7 小时这是一个由讲师指导的中国(线上或线下)培训课程,旨在帮助初学者掌握R语言的基础知识以及如何处理数据。
在本培训结束时,学员将能够:
- 了解R编程环境和RStudio界面。
- 使用R命令和套件导入、处理和探索数据集。
- 执行基本的统计分析和数据摘要。
- 使用base R和ggplot2生成可视化图表。
- 有效管理工作区、脚本和套件。
KNIME Analytics Platform for BI
21 小时KNIME Analytics Platform是数据驱动创新的领先开源选项,可帮助您发现隐藏在数据中的潜力,挖掘新的见解或预测新的未来。 KNIME Analytics Platform拥有1000多个模块,数百个可立即运行的示例,全面的集成工具以及最广泛的高级算法选择,是任何数据科学家和业务分析师的理想工具箱。
KNIME分析平台的这门课程是向KNIME介绍初学者,高级用户和KNIME专家的理想机会,学习如何更有效地使用它,以及如何基于KNIME工作流程创建清晰,全面的报告
Introduction to Data Visualization with Tidyverse and R
7 小时Tidyverse是一系列多功能R包,用于清洁,处理,建模和可视化数据。包括的一些包是:ggplot2,dplyr,tidyr,readr,purrr和tibble。
在这个由讲师指导的实时培训中,参与者将学习如何使用Tidyverse包含的工具来操纵和可视化数据。
在培训结束时,参与者将能够:
- 执行数据分析并创建吸引人的可视化
- 从样本数据的各种数据集中得出有用的结论
- 过滤,排序和汇总数据以回答探索性问题
- 将处理过的数据转换为信息性线图,条形图,直方图
- 导入和过滤来自不同数据源的数据,包括Excel ,CSV和SPSS文件
听众
- 初学者到R语言
- 初学者进行数据分析和数据可视化
课程形式
- 部分讲座,部分讨论,练习和繁重的实践练习