图形计算简介培训

课程编码

graphcomputing

课程时长

28 小时 通常来说是4天,包括中间休息。

要求

  • 了解Java编程和框架
  • 大致了解Python会有帮助,但非必需
  • 大致了解数据库概念

课程概览

大量现实问题可以用图形来描述。例如,Web图形、社交网络图形、火车网络图形、语言图形。这些图形往往太大,处理它们需要一组专门的工具和流程——这些工具和流程可以称为图形计算(也称为图形分析)。

在这一由讲师指导的实时培训中,学员将学习处理图形数据的技术产品和实施方法。目的是识别真实世界里的对象、它们的特征和关系,然后使用图形计算方法对这些关系进行建模并将它们作为数据处理。通过一系列的案例研究、动手练习和实时部署,我们将从广泛的概述开始,然后对特定工具展开详细的学习。

在本次培训结束之后,学员将能够:

  • 理解图形数据如何持久化和遍历
  • 为给定任务选择最佳框架(从图形数据库到批处理框架)
  • 实现Hadoop、Spark、GraphX、Pregel,并行地在多台机器上进行图形计算
  • 从图形、流程、遍历方面查看现实世界的大数据问题

受众

  • 开发人员

课程形式

  • 部分讲座、部分讨论、练习和大量实操

课程大纲

介绍

  • 图数据库和库

理解图形数据

  • 图形作为数据结构
  • 使用顶点(点)和边(线)来模拟真实场景

使用图形数据库建模、持久化、处理图形数据

  • 本地图形算法/遍历
  • neo4j、OrientDB、Titan

练习:使用neo4j建模图形数据

  • 白板数据建模

基于图形数据库:图形计算

  • 理解属性图
  • 图形建模不同场景(软件图、讨论图、概念图)

用遍历解决实际问题

  • 算法/定向遍历图形
  • 确定循环的依赖性

案例研究:排名讨论贡献者

  • 按贡献讨论的数量和深度排名
  • 关于情绪和概念分析的说明

图形计算:本地内存图形工具包

  • 图形分析和可视化
  • JUNG、NetworkX、iGraph

练习:使用NetworkX建模图形数据

  • 使用NetworkX为一个复杂系统建模

图形计算:批处理图形框架

  • 利用Hadoop进行存储(HDFS)和处理(MapReduce)
  • 迭代算法概述
  • Hama、Giraph、GraphLab

图形计算:图形并行计算

  • 在单个系统中统一ETL,进行探索性分析和迭代图形计算
  • GraphX

设置和安装

  • Hadoop和Spark

GraphX运算符

  • 属性、结构、连接、邻域聚合、缓存和未缓存

使用Pregel API迭代

  • 传递发送、接收、计算的参数

构建图形

  • 在RDD或磁盘上使用顶点和边

设计可扩展算法

  • GraphX优化

访问其他算法

  • PageRank、连通组件、三角计数

练习:网页排名和热门用户

  • 使用文本文件作为输入来构建和处理图形数据

部署到生产

结束语

客户评论

★★★★★
★★★★★

促销课程

订阅促销课程

为尊重您的隐私,我公司不会把您的邮箱地址提供给任何人。您可以享有优先权和随时取消订阅的权利。

我们的客户

is growing fast!

We are looking to expand our presence in China!

As a Business Development Manager you will:

  • expand business in China
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!