ROLAP与大数据
OLAP
大数据相关的场景比较多,常见的有:ETL(数据提取、转换、加载)、实时流式(监控报警、风控等)、机器学习(推荐引擎、用户画像等)、非结构化分析(视频、图片、语音、文本等)、海量大数据在线存储(HBase)、搜索及我们本文讲的OLAP。 其中OLAP(在线联机分析)在很多企业占住分析类的大部分。按照一般的理论又分为,M-OLAP,R-OLAP,H-OLAP。简单区别就是 M-OLAP是基于多维数组的存储模型,也是最原始的OLAP,但需要对数据进行预处理才能形成多维结构,大数据领域Kylin属于此类;R-OLAP是完全基于关系模型进行存放的,只是它根据分析的需要对模型的结构和组织形式进行了优化,目前MPP(greenplum)及MPP on HDFS(Presto、Impala)及SQL on DAG(Hive、Spark)均