阿里EB级大数据体系,如何做到秒级响应、高效赋能?
阿里巴巴如何构建一个从底层的数据采集、处理,到挖掘算法、应用、产品服务的全链路、标准化的大数据体系,使得超过EB级别的海量数据能够高效融合,并以秒级的响应速度,服务并驱动阿里巴巴的业务和外部千万用户的发展?阿里巴巴数据技术及产品部资深技术专家姚滨晖,在2017云栖大会上做了一次非常精彩的分享,今天我们一起来重温。
总体来看,阿里巴巴的生态可以分为六个业务板块:电商、物流、健康、文娱、金融,以及云计算。阿里巴巴通过这些业务,服务了数亿用户,上千万的小微企业,以及上千万的商家。伴随着我们的业务服务,同时截止目前,我们已经沉淀的数据量高达EB级规模。
通过全域数据体系,我们建设、融合、链接了这些来自不同业态的数据。下面这张图,勾勒了阿里巴巴大数据体系。

从下往上看,最底层的是全域数据,第二层是基础数据建设,它包括了人工智能的一些算法。在基
