TiDB原理解析系列（一）---Why Do We Use it？-低调大师

TiDB原理解析系列（一）---Why Do We Use it？

2019-12-29 708

TiDB是PingCAP公司设计的开源分布式NewSQL数据库。由于它兼容MySQL协议，并支持绝大多数SQL功能（比如joins，subqueries, transaction等）。业务能够直接通过MySQL connector去使用它来替换MySQL。
TiDB适合场景：

数据量大，MySQL复杂查询很慢。Online DDL影响业务的使用。
MySQL单机容量或者性能达到瓶颈，不想分库分表或者使用数据库中间件等对业务侵入性较大、对业务有约束的Sharding方案。
有高并发实时写入、实时查询、实时统计分析的需求。
有分布式事务、多数据中心的数据100%强一致性、auto-failover的高可用的需求。

TiDB与MySQL相比，有什么优势，让它更适合上述场景？接下来将从以下六个方面进行对比。

1.`TiDB`实现分布式的`SQL`引擎和存储

MySQL水平扩展一般是主从复制，典型的就是一主多从模式。但这种只适合读多写少的业务。碰到大写入量的业务，这种模式反而会成为瓶颈。那么就必须寻求其他的分布式方案，有以下两种思路：

基于修改MySQL的分布式方案。通过MySQL的Server把InnoDB变成分布式数据库，但由于MySQL生成的执行计划是单机的，这不是一个分布式的Plan。不了解底层分布式存储，是无法选择一个最高效率的执行计划。
基于中间件方式的分布式方案，比如ProxySQL。做一款中间件需要考虑很多，比如通过解析SQL解析出ShardKey，然后根据ShardKey分发请求，再合并结果。另外在中间件这层还需要维护Session并保存缓存结果。大多数方案并不支持分布式Transaction，不支持跨节点Join，无法处理复杂Plan，也不会处理Subqueries。同时业务需要维护ShardKey，不支持ORM导致业务开发效率降低。

以上MySQL的问题是由传统架构模式本身带来的，而TiDB的模式是不一样的。它在TiDB Server层实现了分布式的SQL引擎，依赖TiKV来提供分布式存储和分布式事务支持，分布式的设计也方便做水平扩展。以上MySQL分布式方案带来的问题，TiDB都能做很好的解决，这是架构本身带来的优势。

如上图所示，TiDB集群主要分为以下三个组件：

TiDB Server
TiDB Server负责接收SQL请求，处理SQL相关的逻辑，并通过PD找到存储计算所需数据的TiKV地址，与TiKV交互获取数据，最终返回结果。TiDB Server本身并不存储数据，只负责计算，可以无限水平扩展。通过负载均衡组件（如LVS、HAProxy或F5）对外提供统一的接入地址。
PD Server
Placement Driver(简称PD)是整个集群的管理模块。其主要工作有三个：一是存储集群的元信息（某个Key存储在哪个 TiKV节点）；二是对TiKV集群进行调度和负载均衡（如数据的迁移、Raft group leader成员变更等）；三是分配全局唯一且递增的事务ID（支持分布式事务）。
TiKV Server

TiKV Server负责存储数据，从外部看TiKV是一个分布式的提供事务的Key-Value存储引擎。存储数据的基本单位是 Region，每个Region负责存储一个Key Range（从StartKey到EndKey的左闭右开区间）的数据，每个TiKV节点会负责多个Region。TiKV使用Raft协议做复制，保持数据的一致性和容灾。副本以Region为单位进行管理，不同节点上的多个Region构成一个Raft Group。数据在多个TiKV之间的负载均衡由PD调度，是以Region为单位进行调度。

2.`TiDB`金融级的高可用

MySQL的复制方式是半同步或者是异步，半同步也可以降级成异步。也就是说任何时候数据出了问题是不敢切换的，因为有可能是异步复制，有一部分数据还没有同步过来，这时候切换数据就不一致了。多数据中心的复制和数据中心的容灾，MySQL在这上面是做不好的。
而TiDB/TiKV/PD的三个组件都能容忍部分实例失效，并且不影响整个集群的可用性，支持跨中心部署。
下面分别说明这三个组件的单个实例失效后的服务状态，以及如何进行恢复。

TiDB Server
TiDB Server是无状态的，推荐至少部署两个实例。当单个实例失效时，会影响正在这个实例上进行的服务，从应用的角度看，会出现单次请求失败的情况，重新连接成功后即可继续获得服务。单个实例失效后，可以重启这个实例或者部署一个新的实例。
PD Server
PD是一个集群，通过Raft协议保持数据的一致性，单个实例失效时，如果这个实例不是Raft的leader，那么服务完全不受影响；如果这个实例是Raft的leader，会重新选出新的Raft leader，自动恢复服务。PD在选举的过程中无法对外提供服务，这个时间大约是3秒钟。推荐至少部署三个PD实例，单个实例失效后，重启这个实例或者添加新的实例。
TiKV Server
TiKV是一个集群，通过Raft协议保持数据的一致性（副本数量可配置，默认保存三副本），并通过PD做负载均衡调度。单个节点失效时，会影响这个节点上存储的所有Region。对于Region中的Leader结点，会中断服务，等待重新选举；对于 Region中的Follower节点，不会影响服务。当某个TiKV节点失效，并且在一段时间内（默认10分钟）无法恢复，PD会将其上的数据迁移到其他的TiKV节点上。

3.`TiDB`存储引擎`RocksDB`

MySQL默认存储引擎从2010年起就一直是InnoDB，InnoDB使用B+树数据结构，这与传统的商业数据库相似。TiDB使用RocksDB作为TiKV的存储引擎。
读写性能的测试对比：

RocksDB读性能只有InnoDB-Compress性能的70%。但在高并发下，RocksDB平均响应时间表现要比InnoDB-Compress好。但与未压缩的InnoDB还是差不少。
RocksDB写性能表现优异，QPS大概是InnoDB-Compress的10倍。

RocksDB优势是在于处理大型数据集，因为它可以更有效地压缩数据并且插入数据性能优秀。
6亿4千万数据导入MySQL，InnoDB未经压缩大小为160GB，InnoDB-Compress为86GB，RocksDB为62GB。
TiDB更加适合大规模数据场景。数据条数少于5000w的场景下通常用不到TiDB，单机MySQL能满足的场景也不需要用到TiDB。

4.`TiDB`更好的解决了`Online DDL`问题

业务发展迅速，应用模式频繁更改是常态。相应地，数据库访问模式和Schema也随之变化。DDL是SQL的一类，主要作用是创建和更改数据的Schema信息，最常见的操作包括：加减列、更改列类型、加减索引等。5.6版本以后，MySQL内部开始支持Online DDL。但MySQL的Online DDL方案始终没有解决下面问题：MySQL主备副本之间通过Binlog同步，主的Schema变更成功后，才会写BinLog同步给备库，然后备库才开始做DDL。假设一个DDL变更需要一个小时，那么备库最多可能会延迟两倍的变更时间。若变更期间，主库发生故障，备库数据还未追平，则无法提供服务的。
TiDB使用Google F1论文介绍的协议实现在线DDL。Tikv基本不感知DDL操作。对于Tikv来说，所有的操作都是PUT/GET/DELETE，所以副本间的变更也与普通DML没有差异。任何时候，只要底层raft协议能正常work，三副本高可用和强一致就能得到保证。这个方案虽然Schema变更比较麻烦，但对于Tikv存储层特别友好，不用感知DDL，共用一套机制保证高可用和强一致。不会出现类似MySQL主备延迟和主备Schema不一致问题。DDL更改也被分解成更小的转换阶段，这样它们可以防止数据损坏场景，并且系统允许单个节点一次最多支持一个DDL版本。

5.`TiDB`提供一站式`HTAP`解决方案

MySQL团队把注意力放在优化联机事务处理（OLTP）查询的性能上。也就是说，MySQL团队花费更多的时间使简单查询执行得更好，而不是使所有或复杂查询执行得更好。这种方法没有错，因为许多应用程序只使用简单的查询。
TiDB设计目标在处理混合事务/分析处理（HTAP）的性能上。对于那些希望对数据进行实时分析的应用来说，这是一个主要的卖点，因为它消除了在MySQL数据库和分析数据库之间进行的批量加载。一份存储同时处理OLTP & OLAP，无需传统繁琐的ETL 过程。

6.`TiDB`可视化监控与告警

这一点对运维非常友好。MySQL将关键监控指标放在内存表中，获取它需要通过SQL查询，可视化与告警部分都需要额外开发。而TiDB提供Metrics接口，使用 Prometheus记录组件中各种操作的详细信息，使用Grafana进行可视化展示。无须其他开发额外，根据需要，即可配置定制化自己的监控图表和报警。

总结

在替代MySQL的场景中，TiDB与MySQL相比更加适合大数量的场景；同时也补充了MySQL的不足，比如处理Online DDL问题；在MySQL不适合的场景中，比如HTAP场景中也能发挥很好的优势。如果你想更多了解TiDB作者的初衷，参阅How do we build TiDB，Meet TiDB: An open source NewSQL database。

微信关注我们

原文链接：https://yq.aliyun.com/articles/741150

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

使用函数工作流+函数计算轻松构建 ETL 离线数据处理系统

前言随着云计算、人工智能、物联网等新技术的应用普及，人类产生的数据呈现出了爆发式增长的态势，对数据处理的需求能力也提出了越来越高的要求。数据成了重要资产，收集、处理数据的能力成为了核心竞争力，比如：应用服务的运行监控，运营数据的分析，以及深度学习的数据过滤、预处理等，这些对已有数据的处理能力将直接影响服务的运营效率。我们可以使用现成的 ETL 系统完成上述目的，但是在很多情况下您可能希望自建服务。比如：您的数据处理业务不定时运行，希望在无任务时，不消耗任何资源；您的数据处理需求只有简单的几个步骤，"杀鸡焉用牛刀"？还是自建来的快点；您的数据处理业务流程有较多的自定义步骤，但现成系统灵活性不足，自建才能满足业务需求；您不希望消耗过多精力搭建和维护系统中使用的各类开源数据处理模块，但希望在大并发数据处理请求的场景下能够有较为良好的性能表现。如果您有上述需求，或者希望实现一个高度灵活、高度可靠、低成本、高性能的离线数据处理系统，那么本文提供的 Serverless 技术方案将是您的最佳选择。业务场景简介场景：假设我们有一批待处理数据，数据的值为 data_1 或 data...

2019-12-29

942

信息摘要：分析型数据库 PostgreSQL6.0 商业化，新一代在线数据仓库服务，事务处理速度提升60倍适用客户：金融/新零售/数字政务/互联网金融/电子商务/版本/规格功能： AnalyticDB PostgreSQL 6.0 产品性能和功能大幅提升。首先 6.0 版本提升了在混合事务分析（ HTAP）场景的服务性能，在线事务事务处理能力大幅提升，短查询性能相比较线上4.3版提高 70倍；同时 6.0 加强了对于半结构化数据类型的支持能力，支持存储，搜索、分析和查询半结构化文件，支持 JSONb和HSTORE Data Types 类型，大大拓展了大数据分析的业务应用领域和场景；另外 6.0 版本针对关联查询场景也提供了复制表功能，实现维度小表与本地数据表实时关联查询，避免数据在集群内迁移，分析性能达到进一步优化提升，是企业构建企业实时数仓的最佳解决方案！架构案例：https://promotion.aliyun.com/ntms/act/adbrdsdatawarnhouseshangyehua.html?wh_ttid=pc技术深度解析：https://yq.aliyu...

2019-12-29

722

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。