MySQL——RDS下的分区表实践

2019-07-24 700

实践背景

项目中有的表空间太大，且行数太多，故决定对一些表进行分库分表。再研究选型方案的时候发现常用的一些分库分表的解决方案对业务代码修改较多，故决定采用MySQL的分区方案。

其实在我个人看来，分区表就是MySQL帮我们实现了底层的分库分表，不需要涉及业务代码的修改，不需要关注分布式事务。因为就访问数据库而言，逻辑上还是只有一个表，但是实际上确有多个物理分区对象组成，会根据具体的分区规则查询具体的分区。

介绍一下这次实践的表，表空间大小172G，1亿2千万条记录。

数据库版本：RDS MySQL 5.6

工具：阿里云DTS

一、为什么分区？

优点：

对已过期或者不需要保存的数据，可以通过删除与这些数据有关的分区来快速删除数据，它的效率远比DELETE高
在where子句中包含分区条件时，可以只扫描必要的一个或者多个分区来提高查询效率

例如下面语句：

SELECT * FROM t PARTITION（p0，p1）WHERE c <5 仅选择与WHERE条件匹配的分区p0和p1中的记录

涉及聚合函数SUM()、COUNT()的查询时，会在每个分区上并行处理
分区把原本一个表的数据存储在多个物理磁盘上，实现了更高的IOPS

缺点：

无法使用外键，不支持全文索引（现在应该也没什么公司还在用外键吧）
分区键设计不太灵活，如果不走分区键，很容易出现全表锁
开发写一个SQL，不清楚mysql是怎么玩的

二、RANGE分区

目前MySQL支持范围分区（RANGE），列表分区（LIST），哈希分区（HASH）以及KEY分区四种。

本文是以范围分区（RANGE）对时间进行的分区的，故我就简单介绍一下RANGE分区。更多分区类型详见官方文档MySQL 5.6 分区类型

基于一个给定连续区间的列值，根据区间分配分区。最常见的是基于时间字段。其实基于分区的列最好是整型，如果日期型的可以使用函数转换为整型。MySQL 5.6支持的分区函数

本例中使用TO_DAYS函数

CREATE TABLE members (
    id VARCHAR(25) NOT NULL,
    firstname VARCHAR(25) NOT NULL,
    lastname VARCHAR(25) NOT NULL,
    username VARCHAR(16) NOT NULL,
    email VARCHAR(35),
    joindate DATETIME NOT NULL DEFAULT '0000-00-00 00:00:00',
    PRIMARY KEY (id,joindate) USING BTREE,
    KEY idx_joindate (joindate) USING BTREE
)ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT
PARTITION BY RANGE (TO_DAYS(joindate)) (
    PARTITION p0 VALUES LESS THAN (TO_DAYS('1960-01-01')),
    PARTITION p1 VALUES LESS THAN (TO_DAYS('1970-01-01')),
    PARTITION p2 VALUES LESS THAN (TO_DAYS('1980-01-01')),
    PARTITION p3 VALUES LESS THAN (TO_DAYS('1990-01-01')),
    PARTITION p4 VALUES LESS THAN MAXVALUE
);

PS:像例子中的如果你有主键或唯一索引，你必须把你的分区键也加上，其中joindate就是分区键，要不创建会失败！

PS:像上面加了LESS THAN MAXVALUE，后面就不能新加分区了！！！

示例：

如下查询就会落在定义的p2分区内的索引上。故在查询的时候带上你的分区键就会走对应分区查询数据，如果你的条件跨越多个分区进行聚合函数SUM()、COUNT()的查询时，它会在每个分区上并行处理。如果没有带分区键查询就会全表查询。

explain partitions select * from members WHERE joindate BETWEEN '1970-02-03' AND '1970-02-04';

我在迁移完数据进行查询的时候发现一个特别有意思的现象，同一条SQL如果分区键的时间区间不一样，它会根据rows行数少的走不同的范围索引。至于它底层是怎么实现的我就没去研究了

三、分区管理

简单介绍了下范围分区，接下来说一下对分区常用的一下操作。

分区管理包括对于分区的增加，删除，以及查询。更多详见官方文档MySQL 分区管理

1.增加分区

对于RANGE和LIST分区：

alter table table_name add partition (partition p0 values ...(exp))

#例
ALTER TABLE members ADD PARTITION (TO_DAYS('2021-03-01'));

2.删除分区

删除了分区，同时也将删除该分区中的所有数据。如果删除了分区导致分区不能覆盖所有值，那么插入数据的时候会报错。

alter table table_name drop partition p0;

3.查询有多少个分区

SELECT * FROM INFORMATION_SCHEMA.PARTITIONS WHERE TABLE_NAME = 'members';

四、数据迁移

前面说了那么多概念，我说一下本次把大表数据迁移到分区表的过程。

为什么会选择DTS呢？因为它可以不停机迁移数据，支持全量迁移和增量迁移，对原表影响不大。

迁移过程如下：

首先在RDS的同一个实例里面新建了一张同结构的分区表
使用DTS创建迁移任务，迁移时候不要选择结构钱谦益，只选择全量+增量迁移
然后还需要编辑下目标库表名，也就是做下映射从A->B的迁移
停掉写入数据的任务，当任务队列为空时，等待几分钟暂停并结束迁移任务
最后修改表名，完成数据迁移和切换（我在测试环境修改分区表名要一些时间，但RDS修改表名是秒改）

参考官方文档：MySQL 5.6 分区

以上纯属个人观点，如有不对欢迎指正。

微信关注我们

原文链接：https://my.oschina.net/u/2963821/blog/3078511

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

容器化你的 Spring Boot 工程——Docker

环境声明： Gradle + Docker + Spring Boot2.1.5.RELEASE 目的利用docker容器技术简化项目部署配置Docker服务（Ubuntu）卸载旧版本docker（全新安装时，无需执行该步骤） sudo apt-get remove docker docker-engine docker.io 更新系统软件 sudo apt-get update 安装依赖包 sudo apt-get install \ apt-transport-https \ ca-certificates \ curl \ software-properties-common 添加官方密钥 curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - 如果出现‘sudo: unable to resolve host {你的主机名}’，需要编辑你的hosts文件 vim /etc/hosts 127.0.0.1 localhost # 添加下边这行 12...

2019-07-24

910

作为一个应届毕业生，进入阅文集团，加入到通用平台中心之后，随着日常工作的逐步深入，我渐渐了解阅文的技术体系，其中尤其以腾讯TARS平台最为重要。目前TARS平台承载了阅文内部绝大多数的服务，每日接口调用最大值近百亿，单业务峰值可在数万每秒，近300个业务服务。作为一个新人，我来讲下我从TARS小白到熟练工的历程中整理的一些知识点。 TARS文件 TARS作为一个服务治理框架，最基础的还是要解决服务间调用的问题，这样就引入一个问题：如何在多个服务之间发布接口协议。TARS创新性的设计了一种接口描述语言，即TARS文件，在TARS文件中，可以编写模型、接口、枚举等。在服务提供方，我们可以通过tars-maven-plugin解析TARS文件，生成对应的模型、接口、枚举代码，然后就可以在接口实现类中进行业务逻辑的编写。在对外提供服务时，调用方只需要拿到服务提供方的TARS文件，就能了解服务提供的所有接口及相关描述，从而生成客户端调用代码，进行服务接口调用。 module TestApp { interface Hello { string hello(int no, string n...

2019-07-25

873

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。