分布式架构设计篇(六)-刚性事务之3PC详解
引言:2PC必须注意的问题
咱们上文介绍了分布式事务的常见方案、类型划分、2PC的起源和流程。但是不幸的是2PC还是存在几个问题:
1、全流程的同步阻塞:不管是第一阶段还是第二阶段,所有参与节点都是事务阻塞型。当参与者占有公共资源时,其他第三方访问公共资源可能不得不处于阻塞状态。
2、TM单点故障:由于全流程依赖TM的协调,一旦TM发生故障。参与者会一直阻塞下去。尤其在第二阶段,TM发生故障,那么所有的参与者还都处于锁定事务资源的状态中,而无法继续完成事务操作。所有参与者必须等待TM重新上线(TM重新选举)后才能继续工作。
3、TM脑裂引起数据不一致:在第二阶段中,当TM向参与者发送commit请求之后,发生了局部网络异常或者在发送commit请求过程中TM发生了故障,这会导致只有一部分参与者接受到了commit请求。而在这部分参与者接到commit请求之后就会执行commit操作。但是其他部分未接到commit请求的机器则无法执行事务提交。于是整个分布式系统便出现了数据不一致性的现象。
4、TM脑裂引起事务状态不确定:TM再发出commit消息之后宕机,而接收到这条消息的参与者同时也宕机了。那么即使通过选举协议产生了新的TM,这条事务的状态也是不确定的,没人知道事务是否被已经提交。
一、3PC定义
2PC是CP的刚性事务,追求数据强一致性。但是通过我们上面分析可以得知TM脑裂可能造成数据不一致和事务状态不确定问题。无法达到CP的完美状态。因此业界就出现了3PC,用来处理TM脑裂引起的数据不一致和事务状态不确定问题。
因为3PC是为彻底解决的2PC的数据不一致和事务状态不确定问题而出现。根据这一个前提,加上笔者对3PC的理解,总结出3PC的注释事项:
1)3PC确保任何分支下的数据一致性
2)3PC确保任何分支最多3次握手得到最终结果(超时机制)
3)RM超时后的事务状态必须从TM获取。2PC只有TM的超时机制,3PC新增了参与者(RM)的超时机制,一方面辅助解决了2PC的事务/事务问题,还能降低一定的同步阻塞问题。因为TM、RM双向超时机制,所以维基百科对3PC定义为“非阻塞”协议。
二、优雅的3PC流程
3PC 分成3个阶段:CanCommit(准备阶段)、PreCommit(对齐阶段)、DoCommit(提交阶段);笔者根据资料对3阶段进行比较合适的翻译,非官方翻译。
准备阶段:跟2PC的表决阶段很类似,TM向参与者发送commit请求,参与者如果可以提交就返回Yes,否则返回No,询问超时默认参与者为No。唯一差别在于SQL层面:准备阶段只做了SQL处理,并未记录事务日志(Undo 和Redo)
对齐阶段:TM 和 各个参与者对齐事务状态,TM 通知各个参与者事务最终状态,各个参与者如果一致未收到事务对齐通知,会在超时后从TM反查事务状态实现事务状态对齐。在SQL层面:事务状态对齐后,记录事务日志(Undo 和Redo)
提交阶段:该阶段进行真正的事务提交。根据第二阶段得到的事务状态结果,各参与者根据TM的通知命令进行提交/abort或者超时后自动提交/abort。
下图是笔者根据资料和个人理解整理出来的一个自认为比较合理的3PC流程图:
三、总结
或许3PC也不完美,网上有好多各版本的3PC的流程图和解释。有的甚至还存在明显的问题,为3PC的理解带来了更大的苦难。身为架构师,就需要去追寻本质,了解3PC的前世今生,抓住3PC的本质,就很容易理解3PC了。
对于数据一致性,Google Chubby的作者Mike Burrows说过:“there is only one consensus protocol, and that’s Paxos” – all other approaches are just broken versions of Paxos。”
译文:世上只有一种一致性算法,那就是Paxos,所有其他一致性算法都是Paxos算法的不完整版。
- 作者介绍 -
林淮川
毕业于西安交通大学;奈学教育《百万架构师训练营》讲师及企业级源码内源负责人,前大树金融高级架构师;前大树金融技术委员会开创者;前大树金融供应链金融技术总监;前天阳宏业交易事业部技术主管;多年互联网金融行业(ToB)经验。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
乌克兰黑客入侵美国证券,美国国务院悬赏100万$获取黑客信息
美国国务院今天宣布悬赏100万美元,以奖励可能导致逮捕或定罪乌克兰国民Artem Viacheslavovich Radchenko和Oleksandr Vitalyevich Ieremenko的信息。 国务院根据跨国有组织犯罪奖励计划(TOCRP)提供了100万美元的赏金,并表示已根据TORCP支付了超过1.3亿美元的奖励,以奖励导致逮捕75名跨国犯罪分子的信息。 Radchenko和Ieremenko于2019年1月被控以证券欺诈共谋,计算机欺诈共谋,电汇欺诈共谋,电汇欺诈以及16项未密封起诉书中的计算机欺诈(此处为SEC投诉)。 Artem Radchenko和Oleksandr Ieremenko(美国国务卿) 据称,拉琴科协调了一项国际证券欺诈计划,并招募了艾里缅科和其他黑客,这些黑客通过“目录遍历攻击,网络钓鱼攻击和感染”破坏了美国证券交易委员会(SEC)的电子数据收集,分析和检索(EDGAR)系统。具有恶意软件的计算机”。 据起诉书称,在获得了SEC的EDGAR系统访问权后,黑客据称在2016年5月至2016年10月之间窃取了数千份文件,包括年度和季度收益报告以及公开交...
- 下一篇
JVM系列之:Contend注解和false-sharing
简介 现代CPU为了提升性能都会有自己的缓存结构,而多核CPU为了同时正常工作,引入了MESI,作为CPU缓存之间同步的协议。MESI虽然很好,但是不当的时候用也可能导致性能的退化。 到底怎么回事呢?一起来看看吧。 false-sharing的由来 为了提升处理速度,CPU引入了缓存的概念,我们先看一张CPU缓存的示意图: CPU缓存是位于CPU与内存之间的临时数据交换器,它的容量比内存小的多但是交换速度却比内存要快得多。 CPU的读实际上就是层层缓存的查找过程,如果所有的缓存都没有找到的情况下,就是主内存中读取。 为了简化和提升缓存和内存的处理效率,缓存的处理是以Cache Line(缓存行)为单位的。 一次读取一个Cache Line的大小到缓存。 在mac系统中,你可以使用sysctl machdep.cpu.cache.linesize来查看cache line的大小。 在linux系统中,使用getconf LEVEL1_DCACHE_LINESIZE来获取cache line的大小。 本机中cache line的大小是64字节。 考虑下面一个对象: public class...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- Hadoop3单机部署,实现最简伪集群
- CentOS8编译安装MySQL8.0.19
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装Docker,最新的服务器搭配容器使用
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程