分布式架构设计篇(六)-刚性事务之3PC详解-低调大师

分布式架构设计篇(六)-刚性事务之3PC详解

2020-07-21 681

引言：2PC必须注意的问题

咱们上文介绍了分布式事务的常见方案、类型划分、2PC的起源和流程。但是不幸的是2PC还是存在几个问题：

1、全流程的同步阻塞：不管是第一阶段还是第二阶段，所有参与节点都是事务阻塞型。当参与者占有公共资源时，其他第三方访问公共资源可能不得不处于阻塞状态。

2、TM单点故障：由于全流程依赖TM的协调，一旦TM发生故障。参与者会一直阻塞下去。尤其在第二阶段，TM发生故障，那么所有的参与者还都处于锁定事务资源的状态中，而无法继续完成事务操作。所有参与者必须等待TM重新上线(TM重新选举)后才能继续工作。

3、TM脑裂引起数据不一致：在第二阶段中，当TM向参与者发送commit请求之后，发生了局部网络异常或者在发送commit请求过程中TM发生了故障，这会导致只有一部分参与者接受到了commit请求。而在这部分参与者接到commit请求之后就会执行commit操作。但是其他部分未接到commit请求的机器则无法执行事务提交。于是整个分布式系统便出现了数据不一致性的现象。

4、TM脑裂引起事务状态不确定：TM再发出commit消息之后宕机，而接收到这条消息的参与者同时也宕机了。那么即使通过选举协议产生了新的TM，这条事务的状态也是不确定的，没人知道事务是否被已经提交。

一、3PC定义

2PC是CP的刚性事务，追求数据强一致性。但是通过我们上面分析可以得知TM脑裂可能造成数据不一致和事务状态不确定问题。无法达到CP的完美状态。因此业界就出现了3PC，用来处理TM脑裂引起的数据不一致和事务状态不确定问题。

因为3PC是为彻底解决的2PC的数据不一致和事务状态不确定问题而出现。根据这一个前提，加上笔者对3PC的理解，总结出3PC的注释事项：

1）3PC确保任何分支下的数据一致性
2）3PC确保任何分支最多3次握手得到最终结果(超时机制)
3）RM超时后的事务状态必须从TM获取。2PC只有TM的超时机制，3PC新增了参与者(RM)的超时机制，一方面辅助解决了2PC的事务/事务问题，还能降低一定的同步阻塞问题。因为TM、RM双向超时机制，所以维基百科对3PC定义为“非阻塞”协议。

二、优雅的3PC流程

3PC 分成3个阶段：CanCommit(准备阶段)、PreCommit(对齐阶段)、DoCommit(提交阶段)；笔者根据资料对3阶段进行比较合适的翻译，非官方翻译。

准备阶段：跟2PC的表决阶段很类似，TM向参与者发送commit请求，参与者如果可以提交就返回Yes，否则返回No，询问超时默认参与者为No。唯一差别在于SQL层面：准备阶段只做了SQL处理，并未记录事务日志(Undo 和Redo)

对齐阶段：TM 和各个参与者对齐事务状态，TM 通知各个参与者事务最终状态，各个参与者如果一致未收到事务对齐通知，会在超时后从TM反查事务状态实现事务状态对齐。在SQL层面：事务状态对齐后，记录事务日志(Undo 和Redo)

提交阶段：该阶段进行真正的事务提交。根据第二阶段得到的事务状态结果，各参与者根据TM的通知命令进行提交/abort或者超时后自动提交/abort。

下图是笔者根据资料和个人理解整理出来的一个自认为比较合理的3PC流程图：

三、总结

或许3PC也不完美，网上有好多各版本的3PC的流程图和解释。有的甚至还存在明显的问题，为3PC的理解带来了更大的苦难。身为架构师，就需要去追寻本质，了解3PC的前世今生，抓住3PC的本质，就很容易理解3PC了。

对于数据一致性，Google Chubby的作者Mike Burrows说过：“there is only one consensus protocol, and that’s Paxos” – all other approaches are just broken versions of Paxos。”

译文：世上只有一种一致性算法，那就是Paxos，所有其他一致性算法都是Paxos算法的不完整版。

- 作者介绍 -

林淮川

毕业于西安交通大学；奈学教育《百万架构师训练营》讲师及企业级源码内源负责人，前大树金融高级架构师；前大树金融技术委员会开创者；前大树金融供应链金融技术总监；前天阳宏业交易事业部技术主管；多年互联网金融行业（ToB）经验。

微信关注我们

原文链接：https://my.oschina.net/u/133079/blog/4413078

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

乌克兰黑客入侵美国证券，美国国务院悬赏100万$获取黑客信息

美国国务院今天宣布悬赏100万美元，以奖励可能导致逮捕或定罪乌克兰国民Artem Viacheslavovich Radchenko和Oleksandr Vitalyevich Ieremenko的信息。国务院根据跨国有组织犯罪奖励计划(TOCRP)提供了100万美元的赏金，并表示已根据TORCP支付了超过1.3亿美元的奖励，以奖励导致逮捕75名跨国犯罪分子的信息。 Radchenko和Ieremenko于2019年1月被控以证券欺诈共谋，计算机欺诈共谋，电汇欺诈共谋，电汇欺诈以及16项未密封起诉书中的计算机欺诈(此处为SEC投诉)。 Artem Radchenko和Oleksandr Ieremenko(美国国务卿) 据称，拉琴科协调了一项国际证券欺诈计划，并招募了艾里缅科和其他黑客，这些黑客通过“目录遍历攻击，网络钓鱼攻击和感染”破坏了美国证券交易委员会(SEC)的电子数据收集，分析和检索(EDGAR)系统。具有恶意软件的计算机”。据起诉书称，在获得了SEC的EDGAR系统访问权后，黑客据称在2016年5月至2016年10月之间窃取了数千份文件，包括年度和季度收益报告以及公开交...

2020-07-23

750

简介现代CPU为了提升性能都会有自己的缓存结构，而多核CPU为了同时正常工作，引入了MESI，作为CPU缓存之间同步的协议。MESI虽然很好，但是不当的时候用也可能导致性能的退化。到底怎么回事呢？一起来看看吧。 false-sharing的由来为了提升处理速度，CPU引入了缓存的概念，我们先看一张CPU缓存的示意图： CPU缓存是位于CPU与内存之间的临时数据交换器，它的容量比内存小的多但是交换速度却比内存要快得多。 CPU的读实际上就是层层缓存的查找过程，如果所有的缓存都没有找到的情况下，就是主内存中读取。为了简化和提升缓存和内存的处理效率，缓存的处理是以Cache Line（缓存行）为单位的。一次读取一个Cache Line的大小到缓存。在mac系统中，你可以使用sysctl machdep.cpu.cache.linesize来查看cache line的大小。在linux系统中，使用getconf LEVEL1_DCACHE_LINESIZE来获取cache line的大小。本机中cache line的大小是64字节。考虑下面一个对象： public class...

2020-07-23

679

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。