课程大纲

spark.mllib:数据类型、算法和实用程序

    数据类型 基本统计 汇总统计 相关性 分层抽样 假设检验 流显著性测试 随机数据生成
分类和回归 线性模型(支持向量机、逻辑回归、线性回归)
  • 巴纳勒古尔贝叶斯
  • 决策树
  • 树的集合(Random Forests 和梯度提升树)
  • 等渗回归
  • 协同过滤 交替最小二乘法 (ALS)
  • 聚类 k-均值
  • 高斯混合物
  • 电源迭代聚类 (PIC)
  • 潜在狄利克雷津贴 (LDA)
  • 平分 k 均值
  • 流式 k-means
  • 降维 奇异值分解 (SVD)
  • 主成分分析(PCA)
  • 特征提取和转换
  • 频繁的模式挖掘 FP-增长
  • 关联规则
  • 前缀跨度
  • 评估指标
  • PMML 模型导出
  • 优化(针对开发人员) 随机梯度下降
  • 内存有限 BFGS (L-BFGS)
  • spark.ml:用于 ML 管道的高级 API
  • 概述:估算器、变压器和管道 提取、转换和选择特征 分类和回归 聚类 高级主题

    要求

    了解以下其中一项知识:

    • 爪哇岛
    • Scala
    • 火花R。
      35 小时
     

    人数


    开始

    完结


    Dates are subject to availability and take place between 09:30 and 16:30.
    Open Training Courses require 5+ participants.

    客户评论 (8)

    相关课程

    课程分类