当你学会炒菜的时候,你就学会了大数据
最近在学习数仓跟BI,突然发现,结合自己所学会抄的菜。试着把学过的大数据重新理解一番,希望各位都能来一起讨论,共同进步。 走进厨房 走进厨房后,相信大家会看到各种锅碗瓢盆,案板,切菜刀,调料,橱柜,水池...........而这些就相当于是大数据的架构。 其中橱柜,相当于是Hadoop。橱柜可以储存各种食材,而Hadoop可以存储各种不同类的数据(结构化与非结构化)。而橱柜可以存放不同食材,比如不规整的豆腐块,大冬瓜,土豆....还有一些规整的食材,比如大米,小米,绿豆........规整的食材与不规整的食材的区别,各家有各家不同的规定,而一般的规定就是规格的食材要用袋子把它们装起来。这里就相当于是大数据里的数据整理流程。而这些半规整的食材要放到一个个小袋子里,比如说,淀粉,姜粉,蒜泥.....用袋子或者盒子把它们装好,放在相应橱柜的地方,就相当于我们大数据里说的ETL(抽取,封装,加载),以备后用。 而不同厂家的橱柜又会有不同的格子划分及存储区,比如:欧派,宜家的橱柜就会划分出很多小的分区来装不同的东西。而这一块就相当于HBase,灶台下边有专门用于凉碗的,还有抽油烟机旁边专门...