MySQL复制延迟优化的方法论-低调大师

MySQL复制延迟优化的方法论

2018-07-31 664

一、MySQL为什么会延迟

数据延迟：是指master执行了N个事务，slave却只执行了N-M个事务，说明master和slave之间产生了延迟

延迟原因：延迟的原因很多种，大部分情况下是 slave的处理能力跟不上master导致

接下来，我们从各种角度分析下延迟的原因

1.1 MySQL复制的架构

通过架构图，可以直观的看到数据延迟的点有哪些，当然也就可以知道如何优化了

1.2 大事务导致的延迟

大家都知道，binlog的写入时机是在commit的时候，redo的写入时机是在事务执行阶段就开始。

Oracle是通过物理复制，我们姑且认为是redo的复制，因为redo是事务执行阶段就开始写入的，所以，oracle的复制几乎没有延迟

MySQL是基于binlog复制的，如果有一个非常大的事务，如果需要1个小时，那么master在1小时候后才会生成binlog，而此时，slave就比master慢了至少1个小时，还不算是binlog传输时间

这是第一种延迟原因，破解方法后面说

PS: DDL虽然不是事务，但是特性跟大事务一样，都是在master上执行了一个巨大无比的操作才写的binlog

1.3 IO线程导致的延迟

根据复制的架构，Master写完binlog后，需要通过网络传输给slave（这部分我们需要网络的支持）
然后呢，IO thread会将binlog写到slave的relay log中，这部分工作由IO thread完成

好了，这里我们分析下瓶颈：

io thread 是单线程的
io thread 写入 relay log的速度

经过分析以及大量的实战，IO thread并不是我们的瓶颈，因为relay log是顺序的写入，非常快，几乎碰不到瓶颈

1.4 SQL线程导致的延迟

master 上面的事务是可以进行并发的，然后binlog传输到slave后，slave是却以单线程的模式读取和执行relay log
这是典型的消费能力不足

1.5 网络问题导致的延迟

网络问题不用多说了吧，如果要复制良好，一个稳定的网路环境是在所难免的

1.6 硬件问题导致的延迟

如果master是SSD，但是slave还是机械硬盘，这样的架构存在延迟也不足为奇

二、延迟场景的解决方案

2.1 DDL

2.1.1 ddl的最佳实践

通过pt-osc 或者 gh-ost 来让ddl拆分成一个个小事务，并且还有流控功能
在slave上先ddl，然后master-slave切换，然后再old master上进行ddl，从而完美的解决了这个问题

2.2 大事务

2.2.1 大事务拆小事务

如果说大事务对于binlog的产生有极大的影响，那么我们认为定义小事务，大事务不允许执行

有大事务的监控，可以基于时间，可以基于数据量，监控到不符合规范的trx自动kill

2.3 大量并发事务

2.3.1 调整安全参数

sync_binlog = 0 && innodb_flush_trx_commit = 0 可以极大的提高事务处理的吞吐量，因为IO fsync的次数变少了，可以非常有效的降低数据延迟

风险：如果slave挂了，需要重做slave

2.3.2 MTS(enhanced multi-threaded slave)

之前有深入讨论过MTS的文章，它主要的功能就是让slave拥有比master更快的并行能力，从而有效的让延迟缩短，甚至无延迟

终极大招

半同步：半同步可以让延迟为0，但是半同步有自动切换为异步复制的可能

全同步： MySQL的group replication 就是这类的代表，这个话题以后再聊

最后，以上就是关于MySQL延迟优化的方法，几乎涵盖了90%的方案，如果大家还有更好的方案，不妨拿出来大家一起探讨

微信关注我们

原文链接：https://yq.aliyun.com/articles/621198

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MySQL并行复制的深入浅出

一、并行复制的背景首先，为什么会有并行复制这个概念呢？ 1. DBA都应该知道，MySQL的复制是基于binlog的。 2. MySQL复制包括两部分，IO线程和 SQL线程。 3. IO线程主要是用于拉取接收Master传递过来的binlog，并将其写入到relay log 4. SQL线程主要负责解析relay log，并应用到slave中 5. 不管怎么说，IO和SQL线程都是单线程的，然后master却是多线程的，所以难免会有延迟，为了解决这个问题，多线程应运而生了。 6. IO多线程？ 6.1 IO没必要多线程，因为IO线程并不是瓶颈啊 7. SQL多线程？ 7.1 没错，目前最新的5.6，5.7，8.0 都是在SQL线程上实现了多线程，来提升slave的并发度接下来，我们就来一窥MySQL在并行复制上的努力和成果吧二、重点是否能够并行，关键在于多事务之间是否有锁冲突，这是关键。下面的并行复制原理就是在看如何让避免锁冲突三、MySQL5.6 基于schema的并行复制 slave-parallel-type=DATABASE(不同库的事务，没有锁冲突) 之前说过...

2018-08-01

638

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/a724888/article/details/81349388 《码农翻身》读书笔记之浪潮之巅的Web 这是我的后端读书笔记系列文章的第三篇，选取的是最近刚刚圈粉的知名博主刘欣创作的《码农翻身》。本文内容主要根据知名博主刘欣一作《码农翻身》的内容总结而来，本书的内容风趣幽默，讲解计算机理论原理也是十分透彻，由于书中常常以小故事的形式出现，为了方便学习和回顾，我把它们进行了一些改编和整理，便于自己和跟多人阅读。本篇文章主要讲述的书中的第三章“浪潮之巅的Web”。本文首发于我的个人博客：https://h2pl.github.io/ 同时发表在csdn技术博客上：https://blog.csdn.net/a724888 也欢迎来我的GitHub中交流学习：https://github.com/h2pl/ Web的起源很早以前http还没有出现，html也尚未问世，人们最多就是发送一下邮件，用ftp传递文件这些基本的功能。后来为了更好地进行资源共享和展示，出现了html文本，可以在上...

2018-08-01

598

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。