MySQL5.6升级5.7时,出现主从延迟问题排查过程
最近在做zabbix的数据库MySQL5.6升级5.7时,出现主从延迟问题,这个问题困扰了很久没有解决,昨天终于解决了,整理了一下整个排查过程,分享给大家。
环境说明:
mysql主库为5.6的版本,有四个从库,三个为5.6的版本,一个为5.7的版本,所有主从的库表结构均一致,5.7的从库出现大量延迟,5.6的没问题,业务为zabbix监控,基本全部为insert批量插入操作,每条insert SQL插入数据为400-1000行左右。
问题:
MySQL5.7的从库大量延迟,relaylog落盘正常,应用到数据库比较慢,磁盘IO和CPU没有压力,sync_binlog为20000或是0没有区别,max_allowed_packet=128M,innodb_flush_log_at_trx_commit=0,bulk_insert_buffer_size = 128M,binlog_format=row,sync_relay_log=10000,没有使用并行复制,没有开启SSL,没有开启GDID,没有开启半同步。
排查过程:
1:检查各个核对各个和性能相关的参数,没有发现异常。
2:检查网卡、硬盘、更换服务器、数据库服务器重启均没有效果,5.7的延迟依然存在,排除硬件问题。
3:5.7同步主库5.6的binlog到relaylog很快,正常,但是relaylog在5.7数据库中回放效率极低。
4:对比5.6和5.7从库的show engine innodb status结果:
=============5.6===============================
---BUFFER POOL 1
Buffer pool size 655359
Buffer pool size, bytes 10737401856
Free buffers 1019
Database pages 649599
Old database pages 239773
Modified db pages 119309
Pending reads 0
Pending writes: LRU 0, flush list 0, single page 0
Pages made young 10777670, not young 181119246
13.90 youngs/s, 157.51 non-youngs/s
Pages read 8853516, created 135760152, written 784514803
20.96 reads/s, 58.17 creates/s, 507.02 writes/s
Buffer pool hit rate 1000 / 1000, young-making rate 0 / 1000 not 2 / 1000
Pages read ahead 0.00/s, evicted without access 0.00/s, Random read ahead 0.00/s
LRU len: 649599, unzip_LRU len: 0
I/O sum[209618]:cur[2], unzip sum[0]:cur[0]
=============5.7==============================
---BUFFER POOL 1
Buffer pool size 819100
Buffer pool size, bytes 13420134400
Free buffers 1018
Database pages 722328
Old database pages 266620
Modified db pages 99073
Pending reads 0
Pending writes: LRU 0, flush list 0, single page 0
Pages made young 37153, not young 795
0.00 youngs/s, 0.00 non-youngs/s
Pages read 149632, created 572696, written 2706369
0.00 reads/s, 0.00 creates/s, 0.00 writes/s
Buffer pool hit rate 1000 / 1000, young-making rate 0 / 1000 not 0 / 1000
Pages read ahead 0.00/s, evicted without access 0.00/s, Random read ahead 0.00/s
LRU len: 722328, unzip_LRU len: 453903
I/O sum[98685]:cur[0], unzip sum[882]:cur[6]
+++++++++++++++++++++++
对比发现5.7中unzip存在数值,5.6的没有,初步怀疑造成延迟的原因和压缩解压相关。
5:使用perf top -p pidof mysqld查看5.7从库
发现libz.so.1.2.7 [.] crc32的占比要高于mysqld,在6%左右,这个库和压缩解压相关。
6:修改innodb_compression_level的等级为0(就是不启用压缩,默认为6,范围为0-9),观察无效果,延迟依然存在。只是libz的占比下去了,但libc-2.17.so的占比上去了,比mysqld高,在9%左右。使用pstack查看存在研所解压的等待的问题。
7:检查zabbix的历史表,当时为了节约磁盘空间,对这些表做了压缩处理:
CREATE TABLE trends (itemid bigint(20) unsigned NOT NULL,clock int(11) NOT NULL DEFAULT '0',num int(11) NOT NULL DEFAULT '0',value_min double(16,4) NOT NULL DEFAULT '0.0000',value_avg double(16,4) NOT NULL DEFAULT '0.0000',value_max double(16,4) NOT NULL DEFAULT '0.0000',
PRIMARY KEY (itemid,clock),
KEY clock (clock)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=COMPRESSED KEY_BLOCK_SIZE=8
怀疑和ROW_FORMAT=COMPRESSED KEY_BLOCK_SIZE=8这个压缩参数相关。
8:重建所有历史表,去掉ROW_FORMAT=COMPRESSED KEY_BLOCK_SIZE=8,,重新同步,延迟逐步降低,恢复。
疑问:为什么相同的表结构,在5.7中会造成主从延迟而5.6没有?可能是压缩和解压在MySQL5.7中向下兼容性问题造成的,没有深究,但给官方提了一个BUG,让官方走源码层面去看看:http://bugs.mysql.com/100702。
在生产中请慎用ROW_FORMAT=COMPRESSED KEY_BLOCK_SIZE=8。和业内几位专家交流,表示MySQL8.0之前的版本压缩不太靠谱,8.0的用ZSTD还好一点。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
一个快要被忘记的数据库开发岗位,但应该被尊重
数据库测试,似乎是被人遗忘的数据库职业,但依然是不错的选择。底下是我在某站找的招聘启事,就连蚂蚁金服都在积极寻找数据库测试人: 要说我经历的项目,大大小小也有几十个,从 C/S, B/S, 再到 B/C/S, M/S. 无论怎么变化,总也离不开 UI/DB 这种框架。 以前 C/S,B/S,自己动手写写没问题,就拿很早的 C/S 架构来说,C 代表了客户端,S 代表了服务器。客户端可以使用 vb, vfp, delphi, c#, java 来写,逻辑都放在数据库服务器上,具体来说,就是封装在存储过程里。 而 B/S 时代,客户端换成了 Browser,也就是浏览器,而 S 端还是数据库服务器。那么 B/S 时代,语言从强编译性语言,逐步向弱编译倾斜。Javascript 和 JQuery 就在这个时候应运而生。 如果说 C/S,B/S 时代还有全栈程序员,现在如此复杂的时代,要做到真正全栈,就特别不容易。仅从测试来说,需要的功底一下子就变得丰富至极。 鉴于前端变化太快,我很明智地选择了 S 端,即数据库服务器。数据库的测试,相对前端来说,稳定得多。 为什么要做数据库测试 一些不同的声...
-
下一篇
SpringBoot RabbitMQ消息队列的重试、超时、延时、死信队列
今天介绍使用SpringBoot实现RabbitMQ消息队列的高级用法。 MQ安装 自动创建 消息重试 消息超时 死信队列 延时队列 一、RabbitMQ的安装 众所周知,RabbitMQ的安装相对复杂,需要先安装Erlang,再按着对应版本的RabbitMQ的服务端,最后为了方便管理还需要安装rabbitmq_management管理端插件,偶尔还会出现一些安装配置问题,故十分复杂。 在开发测试环境下使用docker来安装就方便多了,省去了环境和配置的麻烦。 1. 拉取官方image docker pull rabbitmq:management 2. 启动RabbitMQ docker run -dit --name MyRabbitmq -e RABBITMQ_DEFAULT_USER=admin -e RABBITMQ_DEFAULT_PASS=admin -p 15672:15672 -p 5672:5672 rabbitmq:management rabbitmq:management: image:tag --name:指定容器名; -d:后台运行容器; -t:在新容器内...
相关文章
文章评论
共有0条评论来说两句吧...

微信收款码
支付宝收款码