课程大纲

介绍

  • 图形资料库和库

了解图形数据

  • 作为数据结构的图形
  • 使用顶点 (点) 和边 (线) 对实际场景进行建模

使用图 Database 对图数据进行建模、持久化和处理

  • 局部图演算法/遍历
  • neo4j、OrientDB 和 Titan

练习:使用 neo4j 对图形数据进行建模

  • 白板数据建模

超越图 Databases: Graph Computing

  • 了解属性图
  • 对不同场景进行建模(软体图、讨论图、概念图)

使用 Traversals 解决实际问题

  • 演算法/定向遍历图形
  • 确定圆周

案例研究:对讨论贡献者进行排名

  • 按贡献的讨论的数量和深度排名
  • 关于情绪和概念分析的说明

Graph Computing:本地记忆体图工具包

  • 图形分析和可视化
  • JUNG、NetworkX 和 iGraph

练习:使用 NetworkX 对图形数据进行建模

  • 使用 NetworkX 对复杂系统进行建模

Graph Computing:批处理图形框架

  • 利用 Hadoop 进行存储 (HDFS) 和处理 (MapReduce)
  • 反复运算演算法概述
  • Hama、Giraph 和 GraphLab

Graph Computing: 图并行计算

  • 将 ETL、探索性分析和反复运算图计算统一到一个系统中
  • GraphX

设置和安装

  • Hadoop 和 Spark

GraphX 运算符

  • 属性、结构、连接、邻域聚合、缓存和解缓存

使用 Pregel API 进行反复运算

  • 传递用于发送、接收和计算的参数

构建图

  • 在 RDD 或磁碟上使用顶点和边

设计 Scalable 演算法

  • GraphX 优化

Accessing 其他演算法

  • PageRank, 连通分量, 三角形计数

Exercis:页面排名和顶级使用者

  • 使用文字档作为输入构建和处理图形数据

部署到生产环境

结束语

要求

  • Java 程式设计和框架的底层
  • 对 Python 的一般理解是有说明的,但不是必需的
  • 对资料库概念的一般理解

观众

  • 开发人员
 28 小时

客户评论 (2)

即将举行的公开课程

课程分类