《大数据管理概论》一3.3 基于新型存储的大数据管理
本节书摘来自华章出版社《大数据管理概论》一书中的第3章,第3.3节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看
3.3 基于新型存储的大数据管理
闪存、PCM等新型存储的物理特性、读写特性等均与磁盘有着显著的不同,而目前已有的大数据数据库,其设计理念均是基于磁盘存储,在面对闪存、PCM等新型存储时并不能最大限度发挥新型存储的性能。目前,在基于新型存储的大数据管理方面也有一些研究工作,包括大数据存储、大数据索引、大数据查询和大数据分析等。
3.3.1 存储管理
大数据存储通常采用分布式异构存储策略,但传统的分布式存储策略通常采用基于副本的方式。引入了多样化的新型存储介质后,需要设计新的数据分配算法,使数据分布在合适的新型存储介质上,从而加快数据的访问性能。
异构存储系统的特点在于采用了所谓的日志缓存(buffered