课程大纲

第一天:语言基础

    课程介绍 关于 Data Science Data Science 定义 做的过程 Data Science。
介绍 R Language
  • 变量和类型
  • 控制结构(循环/条件)
  • R Scalars、向量和矩阵 定义 R 向量
  • 母科
  • 字符串和文本操作 字符数据类型
  • 文件 IO
  • 列表
  • 功能 函数简介
  • 闭 包
  • lapply/sapply 函数
  • 数据帧
  • 所有部分的实验室
  • 第二天:中级 R Programming
  • 数据帧和文件 I/O 从文件中读取数据 数据准备 内置数据集 可视化 图形包 plot() / barplot() / hist() / boxplot() /   散点图 热图 ggplot2 包 (qplot(), ggplot())
  • 使用 Dplyr 进行探索
  • 所有部分的 实验室
  • 第三天:高级 Programming 与 R

      使用 R 进行统计建模 统计函数 处理 NA 分布(二项分布、泊松分布、  正态分布)
    回归 线性回归简介
  • 建议
  • 文本处理 (tm package / Wordclouds)
  • 聚类 聚类分析简介

      KMeans(英语:KMeans)
    分类 分类简介
  • 朴素贝叶斯
  • 决策树
  • 使用插入符号包进行训练
  • 评估算法
  • R 和 Big Data 将 R 连接到数据库
  • Big Data 生态系统
  • 所有部分的实验室

    要求

    • 有基本编程背景者优先

    设置

    • 现代笔记本电脑
    • 已安装最新的 R Studio 和 R 环境 
      21 小时
     

    人数


    开始

    完结


    Dates are subject to availability and take place between 09:30 and 16:30.
    Open Training Courses require 5+ participants.

    客户评论 (5)

    相关课程

    课程分类