常见的四种非关系型数据库都适合什么业务场景?
大多数NoSQL数据库的基本理念是面向任务(task-oriented)的数据库管理系统。如同老生常谈:如果你唯一的工具是锤子,那么一切看起来都像钉子(If all you have is ahammer, everything looks like a nail.)。
现在我们有不同种类的锤子、起子、凿子、铲子,还有更多的工具来解决数据管理问题。当然,最好的方法是选择合适的工具来完成不同的工作,如果只用关系数据库事实上可能会适得其反。除SQL数据库外,其他的可以分成四类:
- 键值存储(key-value stores)
- 列式存储(column-family stores)
- 文档存储(document stores)
- 图数据库(graph databases)
键值存储可能是最简单的面向任务的NoSQL数据库。其最初的数据模型并不复杂:主要基于亚马逊在两年一度的ACM操作系统研讨会(ACM Symposium on Operating SystemsPrinciples)上发布的白皮书,一篇叫Dynamo的论文。在此讨论的数据模型就是亚马逊的购物车系统(Amazon's shopping cart system),该系统要求高可用和高负载。因此,键值存储数据库的底层数据模型的确很简单:键和值存储为无模式(schema-less)数据模型。事实上,该系统采用大量的商业硬件搭建成集群,可扩展性非常高,并承载了多个高端应用,比如Amazon等。键值存储的产品还有DynamoDB、Riak、Project Voldemort、Redis、Aerospike等。
列式存储是另一个面向任务的数据库解决方案。其数据模型比键值存储稍复杂,包含一个大而稀疏的表结构,其中包括存储键的多个列。与Dynamo系统类似,列式存储也是源于一个特定公司的特殊需求,即Google公司提出的解决方案,发表在2006年OSDI会议(Operating SystemsDesign and Implementation symposium,操作系统设计与实现研讨会)上的BigTable论文中。除谷歌的产品外,还涌现出一批有趣的开源实现,如Apache Cassandra和HBase。大多数情况下,这些系统可结合Map/Reduce批处理来处理高级查询。
文件存储:随着网页和应用的爆炸式增长,文档存储可能是最有名、最常用的NoSQL数据库类型。顾名思义,文档存储中的关键概念——文档,是一个半结构化的信息单元,可以是XML、JSON、YAML、OpenOffice、MS Office,或者其他任何可用的文档。其存储和检索为简单的无模式方式。文档存储产品包括广受欢迎的MongoDB、Apache CouchDB、MarkLogic和Virtuoso等。
图数据库与其他三类有着本质上的差异。图数据库所要解决的问题与图和图论相关。图数据库,例如Neo4j,其目的是为用户提供一种更好的方法用于管理结构复杂、呈网状分布的数据。当然,基于图模型实现的解决方案并不仅有Neo4j,有的产品成熟度不同,有的开源或闭源,例如AllegroGraph、Dex、FlockDB、InfiniteGraph、OrientDB和Sones等。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
新基建彰显五大网络安全新机遇
自从今年3月初中共中央政治局常务委员会提出要加快5G网络、数据中心等新型基础设施建设进度后,工信部也相继发布了《工业和信息化部关于推动5G加快发展的通知》、《关于开展产业链固链行动 推动产业链协同复工复产的通知》,对加快5G网络、物联网、大数据、人工智能、工业互联网、智慧城市等新基础设施建设提出了进一步的要求。新型基础设施建设的本质其实就是信息数字化的基础设施建设,而作为数字世界重要保障的网络安全建设就更需要紧跟新基建脚步,做好5G、人工智能、工业互联网、物联网的安全防护工作。 全面展开新基建迫在眉睫 今年初新冠疫情突然爆发,新基建的工作进展也被迫拖慢。即便如此,在中央政府安排抗击疫情工作中也多次提出要加快新基建,助力战“疫”,并藉此契机改造提升传统产业,培育壮大新兴产业。随着国内各地复工复产的全面铺开,新基建工作也必然会进入加速状态。实际上,在工信部发布的《工业和信息化部关于推动5G加快发展的通知》里已经明确提出要“加快5G网络建设进度”,“抢抓工期,最大程度消除新冠肺炎疫情影响”。 新基建背后的经济新动能 中国信通院预测,到2025年我国5G网络建设投资总额将达1.2万亿,5G建设...
- 下一篇
Redis Cluster 原理详解,应付面试官就看这一篇!
Redis 缓存作为使用最多的缓存工具被各大厂商争相使用。通常我们会使用单体的 Redis 应用作为缓存服务,为了保证其高可用还会使用主从模式(Master-Slave),又或者是读写分离的设计。但是当缓存数据量增加以后,无法用单体服务器承载缓存服务时,就需要对缓存服务进行扩展。将需要缓存的数据切分成不同的分区,将数据分区放到不同的服务器中,用分布式的缓存来承载高并发的缓存访问。恰好 Redis Cluster 方案刚好支持这部分功能。 今天就来一起看看 Redis Cluster 的核心原理和实践: Redis Cluster 实现数据分区 分布式缓存节点之间的通讯 请求分布式缓存的路由 缓存节点的扩展和收缩 故障发现和恢复 Redis Cluster 实现数据分区 正如开篇中提到的,分布式数据库要解决的就是将整块数据,按照规则分配到多个缓存节点,解决的是单个缓存节点处理数量大的问题。如果要将这些数据进行拆分,并且存放必须有一个算法。例如:哈希算法和哈希一致性算法,这些比较经典的算法。 Redis Cluster 则采用的是虚拟槽分区算法。其中提到了槽(Slot)的概念。这个槽是用来...
相关文章
文章评论
共有0条评论来说两句吧...