课程大纲

介绍

分布式计算原理

    Apache Spark(阿帕奇斯帕克酒店) Hadoop

Data Serialization的原理

    数据对象如何通过网络传递 对象序列化 序列化方法 节俭 协议缓冲区 阿帕奇 Avro 数据结构 尺寸、速度、格式特性 持久数据存储 与动态语言集成 动态类型化 模式 未标记的数据 变更管理

Data Serialization 和分布式计算

    Avro 作为 Hadoop 的子项目 Java 序列化 Hadoop 序列化 Avro 序列化

将 Avro 与

    Hive (阿夫罗塞尔德) 清管 (AvroStorage)

移植现有 RPC 框架

总结和结论

要求

  • 大致熟悉分布式计算。
  14 小时

人数


开始

完结


Dates are subject to availability and take place between 09:30 and 16:30.

每位参与者的报价

客户评论 (3)

相关课程