课程大纲

  1. 大数据下的分布式
    1.  数据挖掘方法(训练单机型+分布式的预测: 传统机器学习算法+Mapreduce 分布式预测,)
    2. Apache Spark MLlib
  2. 推荐与广告精准投放:
    1. 自然语言的部分
    2. 文本聚类,文本分类(标签),同义词
    3. 用户profile还原,标签体系
    4. 推荐算法的策略
    5. 类之间的lift, 类内的lift, 如何精准
    6. 如何构建推荐算法的闭环
  3. 逻辑回归,RankingSVM,
  4. 特征识别:(深度学习与图形的自动特征识别)
  5. 自然语言
    1. 中文分词
    2. 主题模型(文本聚类)
    3. 文本分类
    4. 提取关键词
    5. 语义分析 sementic parser, word2vec到词向量
    6. RNN Long short-term memory (TSTM) Architecture
 21 小时

人数


每位参与者的报价

客户评论 (1)