基于MaxCompute的图计算实践分享-图加载过程
免费开通大数据服务:https://www.aliyun.com/product/odps
一、前言
MaxCompute Graph 是基于飞天平台实现的面向迭代的图处理框架,为用户提供了类似于 Pregel 的编程接口。MaxCompute Graph(以下简称 Graph )作业包含图加载和计算两个阶段:
- 加载,将存储在表中的数据载入到内存中,以点和边的形式存在;
- 计算,遍历内存中的点,经过不断的迭代,直至达到迭代终止; Graph 模型有点(vertex)和边(edge)组成,以邻接表的形式进行组织,如下图:
图的原始数据存在于MaxCompute的表(table)中,每个 table 包含多个记录(record),每个 record 又包含多个列(field),图加载就是将这种形式的数据,转换成 vertex 和 edge的过程