大数据与机器学习:实践方法与行业案例.1.2数据平台
1.2数据平台
数据平台是存放分析数据的平台,也是支持大多数数据分析和数据挖掘应用的底层平台,它使用了统一的数据清洗与处理规则,因而可以保证从基础平台上输出的数据内容是一致的。
传统的数据平台基本等同于大家熟悉的“数据仓库”,但互联网浪潮让人们对数据采集、存储和应用提出了越来越高的要求,传统数据仓库平台独力难支,因此“现代化”的数据平台是多种数据库产品的融合。图1-3是一个精简化的现代数据平台架构图。
图1-3 数据平台架构示意图
现代的数据平台融合了传统数据仓库、大数据平台、MPP数据库、NoSQL数据库等多种数据产品,这些数据库产品之间互为补充,组成统一的数据平台。
从传统的关系型数据库开始,数据库产品逐渐细分,这些细分产品在特定场景中比传统的关系型数据库表现出了更好的性能。图1-4展示了一些主流的数据库产品,注意到有很多数据库产品是