那些年,阿里巴巴技术男神们写的书!
书籍名称:《离线和实时大数据开发实战》
内容提要:
阿里巴巴大数据开发专家撰写,源于十余年工作实践,只讲实用有效的“招式”。庖丁解牛式式讲解离线和实时开发平台架构、原理、开发示例,涵盖查询与优化、建模、数仓开发、流计算开发等核心技术。
本书包含三篇,共计12章内容。
第一篇——数据大图和数据平台大图(第1~2章),主要站在数据处理和数据处理平台的角度,对数据、数据技术、数据相关从业者与角色、离线与实时数据平台架构等,给出整体性介绍。
第二篇——离线数据处理(第3~7章),离线数据是目前整个数据开发的根本和主战场,本篇详细介绍了离线数据处理的各种技术:Hadoop MapReduce、HDFS和Hive的架构、关键原理与使用,以及Hive优化实践、数据建模设计与改良、虚构的某全国连锁零售超市的数据仓库/数据湖实践。
第三篇——实时数据处理(第8
