Spark生态之Spark Graphx介绍、实现分析和实例
Spark GraphX介绍 GraphX介绍 GraphX应用背景 GraphX的框架 发展历程 GraphX实现分析 存储模式 图存储模式 GraphX存储模式 计算模式 图计算模式 GraphX计算模式 图的缓存 邻边聚合 进化的Pregel模式 图算法工具包 GraphX实例 图例演示 例子介绍 程序代码 运行结果 PageRank演示 例子介绍 测试数据 程序代码 运行结果 1、GraphX介绍 1.1GraphX应用背景 Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。 众所周知·,社交网络中人与人之间有很多关系链,例如Twitter、Facebook、微博和微信等,这些都是大数据产生的地方都需要图计算,现在的图处理基本都是分布式的图处理,而并非单机处理。Spark GraphX由于底层是基于Spark来处理的,所以天然就是一个分布式的图处理系统。 图的分布式或者并行处理其实是把图拆分成很多的子图,然后分别对这些子图进行计算,计算的时候可以分别迭代进行分...


