架构设计之「数据库集群方案」-低调大师

架构设计之「数据库集群方案」

2018-10-10 666

在之前的文章中，我们知道数据库服务可能已经成为了很多系统的性能关键点，甚至是瓶颈了。也给大家介绍了数据库服务器从主备架构、到主从架构、再到主主架构的基础方案。但如果单台机器已经不能满足完整业务数据存储的时候，我们就需要考虑采用多机甚至多中心的部署方案了。

今天我们就再来聊一聊，在多机环境下，数据库集群的架构方案。

同样，这里先不看细节，不管底层数据源是什么数据库，我们先谈架构方案。因为无论底层是 Mysql 还是 Redis、MongoDB，我们在架构设计上都是相通的。

针对多机的架构，常见有如下做法：

单中心数据集群
多中心数据分区

下面我们来具体看看：

一、单中心的数据集群架构（单中心多机）

单数据中心多机器的集群又可以分为：

数据集中模式
数据分散模式

这两种的主要区别在于集群中的完整业务数据是全部集中在一台机器上，但是分散在多台机器上。

数据集中模式

如图，

6394c9bec0e3deda74720fc34cbba2cbd7bbf171

这种模式与「一主一从式」（主从式）比较类似，完整的业务数据还是存储在一台主机的上，主机承担读服务和写服务，从机只承担读服务。但是从机有多台机器，从机实时的从主机同步数据。所以这种模式，也可以理解为「一主多从」式。

因为有多个从机，那么也给这种架构带来了一些额外需要处理问题，比如：
1.1，主机需要实时的将数据同步到多台从机上，涉及到主机的处理压力问题。
1.2，需要保障多台从机之间的数据一致性的问题，如果出现数据不一致，如何处理。
1.3，多台从机是如何检测主机状态的，因为从机在关键时刻是要替换主机的，那么如果多台从机监测到的主机状态不一致，那又可能会带来其它问题。
1.4，从机切换为主机的时候，选择哪一台从机来切换呢，这涉及到多台从机之间如何进行选举的问题。

这些问题，在我们进行架构设计的时候，必须提前考虑。不过市面上也有一些工具可以辅助实现，例如 ZooKeeper等。

另外，由于数据集中模式的所有写操作都只到一台主机上，而读操作可以到N台从机上。因此这种模式比较适用于业务数据量不大、读操作远远大于写操作、集群规模较小的业务场景。

数据分散模式

如图，

1317f04045ae567e7616af585ec2a718a322628d

数据分散模式是指，完整的业务数据并非是全部存储在一台主机上的，而是由多台主机共同分担，分散存储。因此这种模式适用于大数据量、集群规模较大的场景。

使用这种模式，也有几点需要特别注意的：
1.1，尽量将数据均衡的分散的各个机上，这样才能保证资源的均衡使用和性能的最佳。
1.2，多台机器上的数据虽然不同，但是也需要互相进行数据的备份。
1.3，要能动态的增加和删除节点，这样可以便于随时扩展，通常采用一致性HASH的方法。

聊完了单数据中心的集群架构，我们再来看看多数据中心的数据分区架构。

二、多中心的数据分区架构（多中心多机）

出于容灾的考虑，通常会在多个不同地区部署多套的数据集群。毕竟在国内运营商网络故障、光纤被山东蓝翔技工铲断等事件还是不少的。轻则一个机房出问题，重则一个城市一个省份都可能故障。

如果我们数据存储服务只部署在一个机房，那如果这个机房出现了故障，很有可能导致不能服务甚至是无法恢复业务了。因此我们就需要考虑多中心的数据分区架构，将数据按照一定的规则进行分区，部署在不同机房/城市里，且每一个分区都存储一部分数据，通过这种方式来保障数据和服务的可用性。

在多中心的数据分区模式下，我们需要提前规划 “分区规则” 。毕竟将数据在地理位置上分区，在网络通讯方面是有时延的，所以必须要考虑好我们是要以区域、还是以城市、还是省份来分节点部署。

除了 “分区规则” ，我们还需要考虑 “备份规则” 。
因为分区之后，各区都只存储一部分数据，并不是完整数据。如果其中一个区出故障了，虽然不会影响全局，但是也会带来一定损失。因此我们需要考虑将每个区里的数据备份起来，备份有几种方式：

集中备份式
独立备份式
相互备份式

下面将这三种备份方式解释一下：

集中备份式

如图，

42b36bb112d5ac3bd6adda9a2ec6d40b1b7acd8f

集中备份式是指建立一个独立的数据备份中心，将各分区（节点）的数据都定期同步到这个备份中心，以保障数据的安全性。这种备份方式可以随意的扩展分区（节点），不受分区的个数限制，并且结构很简单。但是

这种备份方式的缺点就是，投入成本有点高，因为需要额外建立这么一个备份数据中心，平时也是闲置的，有点浪费资源。另外，备份中心自身也可能会有单点的故障，且备份中心中需存储多个分区的数据，还可能会互相受到影响。

独立备份式

如图，

6c21a05296b90f534d5a6e3dbad600c15c0dddc1

独立备份式就是给每一个数据分区（节点）都建立一个额外的备份节点，这个备份节点部署在不同的地域/城市，这样才能起到容灾的作用。

这种备份方式相比较于集中备份式，建设成本就更大一些了，毕竟每一个分区都需要额外建立一个备份节点。但是结构更清晰简单了，而且各个分区的数据之间还可以做到互不影响，完全是独立的。后续扩展分区（节点）的时候，对前面的备份节点也没有影响，扩展性好。

相互备份式

这个暂时没有找到合适的图。

相互备份式其实是结合了上面两种特性在一起的模式。上面的方式不是成本大么，那么这种方式就不额外建立备份中心了，让各个分区（节点）互相备份数据。比如分区A 将自身数据同步一份给分区B备份着，分区B 将自己的数据同步一份给分区A 备份着，如果是三个以上分区，还可以做到循环备份。

这种备份方式，设计稍微复杂一些，扩展性也弱一些，但是可以节约资源。

无论采用哪种方式，都需要结合实际的业务场景来决定。

以上，就是对数据库在多机集群模式下的技术架构的分享，欢迎大家一起交流。

原文发布时间为：2018-10-11

本文作者：奎哥

本文来自云栖社区合作伙伴“云时代架构”，了解相关信息可以关注“云时代架构”。

微信关注我们

原文链接：https://yq.aliyun.com/articles/651192

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

50万年薪都招不来的大数据开发工程师是什么样的？

从2010年至今，大数据投资热潮与大数据岗位开始集中爆发。从360指数我们可以看出，目前大数据在市场的热度远远高于前几年特别火的产品经理。大数据之火热，以致身边很多人对于大数据相关热门趋势及词汇都能随口就来。但如果问他大数据和他之间的关系，却很难能说出一二三来。究其原因，大家置身于大数据环境下，耳濡目染各种新的概念，但是真正参与实践大数据的案例少之又少，造成了对大数据整体认知的缺失。下面讲讲大数据行业不同角色对大数据的观点，希望能够还原出来一个较为全面的认识，了解不同角色对大数据的需求背景。大数据开发 2010开始，大数据成为了分布式技术框架的别名，Hadoop开始频繁进入大家眼中，从此以后，hive，spark，flink等分布式计算框架如雨后春笋进入大家的开发工作环境中（当然大数据的薪资也开始水涨船高，远远高于其他同类开发）。那么在大数据开发的眼中，大数据应该是长这样的：第一：数据体量巨大。大数据的起始计量单位至少是P（1000个T）、E（100万个T）或Z（10亿个T）；第二：数据类型繁多。比如，网络日志、视频、图片、地理位置信息等等；第三：需要不同的框架解决不同...

2018-10-10

628

今天给大家带来关于混部技术的分享，将从以下四方面阐述，重点在前面两个章节：第一，阿里巴巴混部探索简介，混部技术在业界还尚属于较少研究的领域，该技术只有在资源及成本的体量达到一定规模时，才会显现出其可观的技术红利，我会介绍下阿里巴巴关于混部技术的探索历程；第二，混部方案及架构，本次分享将更侧重于运维方面的架构设计及介绍；第三，混部核心技术，由于时间关系，本次分享中仅仅罗列了一些技术点和方向性的东西，不做太多核心技术细节展开；第四，未来展望。一. 阿里巴巴混部探索简介混部技术的出发点，源自于对不断增长的业务和日益攀升的资源成本如何平衡的思考，我们希望用最小的资源成本，支撑更大的业务需求。是否能够复用已有的存量资源，来满足新增的业务，这就是混部技术发展的思想源头。 1.1 为什么做混部？上图是阿里巴巴从2009 年开始做双十一购物狂欢节以

2018-10-10

818

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。