课程大纲

介绍

  • 图形数据库和库

了解图形数据

  • 作为数据结构的图形
  • 使用顶点(点)和边(线)对真实场景进行建模

使用 Graph Database 对图形数据进行建模、持久化和处理

  • 局部图算法/遍历
  • neo4j、OrientDB 和 Titan

练习:使用 neo4j 对图形数据进行建模

  • 白板数据建模

超越 Graph Databases:图计算

  • 了解属性图
  • 不同场景的图形建模(软件图、讨论图、概念图)

使用遍历解决实际问题

  • 算法/定向遍历图形
  • 确定循环悬浮

案例研究:对讨论贡献者进行排名

  • 按参与讨论的数量和深度排名
  • 关于情绪和概念分析的说明

Graph Computing:本地内存中 Graph 工具包

  • 图形分析和可视化
  • JUNG、NetworkX 和 iGraph

练习:使用 NetworkX 对图形数据进行建模

  • 使用 NetworkX 对复杂系统进行建模

Graph Computing: 批处理图框架

  • 利用 Hadoop 进行存储 (HDFS) 和处理 (MapReduce)
  • 迭代算法概述
  • Hama、Giraph 和 GraphLab

Graph Computing: 图并行计算

  • 在单个系统中统一 ETL、探索性分析和迭代图计算
  • GraphX

设置和安装

  • Hadoop 和 Spark

GraphX 运算符

  • 属性、结构、联接、邻域聚合、缓存和解缓存

使用 Pregel API 进行迭代

  • 传递用于发送、接收和计算的参数

构建图表

  • 在 RDD 或磁盘上使用顶点和边

设计 Scalable 算法

  • GraphX 优化

Accessing 其他算法

  • PageRank、连接组件、三角形计数

练习:页面排名和排名靠前的用户

  • 使用文本文件作为输入来构建和处理图形数据

部署到生产环境

闭幕致辞

要求

  • Java 编程和框架的不足
  • 对 Python 的一般理解是有帮助的,但不是必需
  • 对数据库概念的一般了解

观众

  • 开发 人员
  28 小时
 

人数


开始

完结


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

客户评论 (2)

相关课程

课程分类