如何解决由触发器导致 MySQL 内存溢出？

2024-03-12 400

由触发器导致得 OOM 案例分析过程和解决方式。

作者：龚唐杰，爱可生 DBA 团队成员，主要负责 MySQL 技术支持，擅长 MySQL、PG、国产数据库。

爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

本文约 1500 字，预计阅读需要 5 分钟。

问题现象

一台从库服务器的内存使用率持续上升，最终导致 MySQL 服务被 kill 了。

内存监控视图如下：

从图中可以看出，在 00:00 左右触发了 kill，然后又被 mysqld_safe 进程拉起，然后内存又会持续上升。

排查过程

基本信息

数据库版本：MySQL 5.7.32
操作系统版本：Ubuntu 20.04
主机配置：8C64GB
innodb_buffer_pool_size：8G

由于用户环境未打开内存相关的监控，所以在 my.cnf 配置文件中配置如下：

performance-schema-instrument = 'memory/% = COUNTED'

打开内存监控等待运行一段时间后，相关视图查询如下：

从上述截图可以看到，MySQL 的 buffer pool 大小分配正常，但是 memory/sql/sp_head::main_mem_root 占用了 8GB 内存。

查看源代码的介绍：

sp_head：sp_head represents one instance of a stored program.It might be of any type (stored procedure, function, trigger, event).

根据源码的描述可知，sp_head 表示一个存储程序的实例，该实例可能是存储过程、函数、触发器或者定时任务。

查询当前环境存储过程与触发器数量：

当前环境存在大量的触发器与存储过程。

查询 MySQL 相关 bug，这里面提到一句话：

Tried to tweak table_open_cache_instances to affect this?

查询此参数描述：

A value of 8 or 16 is recommended on systems that routinely use 16 or more cores. However, if you have many large triggers on your tables that cause a high memory load, the default setting for table_open_cache_instances might lead to excessive memory usage. In that situation, it can be helpful to set table_open_cache_instances to 1 in order to restrict memory usage.

根据官方的解释可以了解到，如果有许多大的触发器，参数 table_open_cache_instances 的默认至可能会造成内存使用过多。

比如 table_open_cache_instances 设置为 16，那么表缓存会划分为 16 个 table instance。当并发访问大时，最多的情况下一个表的缓存信息会出现在每一个 table instance 里面。

再由于每次将表信息放入表缓存时，所有关联的触发器都被放入 memory/sql/sp_head::main_mem_root 中，table_open_cache_instances 设置的越大其所占内存也就越大，以及存储过程也会消耗更多的内存，所以导致内存一直上升最终导致 OOM。

下面简单验证一下触发器对内存的影响。

当 `table_open_cache_instances` 为 8 时：

#清空缓存

mysql> flush tables;
Query OK, 0 rows affected (0.00 sec)

[root@test ~]# cat test.sh
for i in `seq 1 1 8`
do
mysql -uroot -p test -e "select * from test;"
done

[root@test ~]# sh test.sh

mysql> show variables like '%table_open_cache_instances%';
+----------------------------+-------+
| Variable_name | Value |
+----------------------------+-------+
| table_open_cache_instances | 8 |
+----------------------------+-------+
1 row in set (0.00 sec)

mysql> SELECT current_alloc FROM sys.memory_global_by_current_bytes WHERE event_name='memory/sql/sp_head::main_mem_root';
+---------------+
| current_alloc |
+---------------+
| 119.61 KiB |
+---------------+
1 row in set (0.00 sec)

在该表上创建一个触发器。

mysql> \d|
mysql> CREATE TRIGGER trigger_test BEFORE INSERT ON test FOR EACH ROW BEGIN SIGNAL SQLSTATE '45000' SET message_text='Very long string. MySQL stores table descriptors in a special memory buffer, calle
'> at holds how many table descriptors MySQL should store in the cache and table_open_cache_instances t
'> hat stores the number of the table cache instances. So with default values of table_open_cache=4000
'> and table_open_cache_instances=16, you will have 16 independent memory buffers that will store 250 t
'> able descriptors each. These table cache instances could be accessed concurrently, allowing DML to u
'> se cached table descriptors without locking each other. If you use only tables, the table cache doe
'> s not require a lot of memory, because descriptors are lightweight, and even if you significantly increased the value of table_open_cache, it would not be so high. For example, 4000 tables will take u
'> p to 4000 x 4K = 16MB in the cache, 100.000 tables will take up to 390MB that is also not quite a hu
'> ge number for this number of open tables. However, if your tables have triggers, it changes the gam
'> e.'; END|
Query OK, 0 rows affected (0.00 sec)

#清空缓存

mysql> flush tables;
Query OK, 0 rows affected (0.00 sec)

然后访问表，查看缓存。

[root@test ~]# cat test.sh
for i in `seq 1 1 8`
do
mysql -uroot -p test -e "select * from test;"
done

[root@test ~]# sh test.sh

mysql> SELECT current_alloc FROM sys.memory_global_by_current_bytes WHERE event_name='memory/sql/sp_head::main_mem_root';
+---------------+
| current_alloc |
+---------------+
| 438.98 KiB |
+---------------+
1 row in set (0.00 sec)

可以发现 memory/sql/sp_head::main_mem_root* 明显增长较大。如果有很多大的触发器，那么所占内存就不可忽视（现场环境触发器里面很多是调用了存储过程）。

当 `table_open_cache_instances` 为 1 时：

mysql> flush tables;
Query OK, 0 rows affected (0.00 sec)

mysql> show variables like '%table_open_cache_instances%';
+----------------------------+-------+
| Variable_name | Value |
+----------------------------+-------+
| table_open_cache_instances | 1 |
+----------------------------+-------+
1 row in set (0.00 sec)

SELECT current_alloc FROM sys.memory_global_by_current_bytes WHERE event_name='memory/sql/sp_head::main_mem_root';
+---------------+
| current_alloc |
+---------------+
| 119.61 KiB |
+---------------+
1 row in set (0.00 sec)

mysql> #访问表

mysql> system sh test.sh

mysql> SELECT current_alloc FROM sys.memory_global_by_current_bytes WHERE event_name='memory/sql/sp_head::main_mem_root';
+---------------+
| current_alloc |
+---------------+
| 159.53 KiB |
+---------------+
1 row in set (0.00 sec)

可以发现 memory/sql/sp_head::main_mem_root 所占内存增长较小。

由于大量触发器会导致表缓存和 memory/sql/sp_head::main_mem_root 占用更多的内存，根据实际环境，尝试把该从库的 table_open_cache_instances 修改为 1 后观察情况。

可以看到内存值趋于稳定，未再次出现内存使用率异常的问题。

总结

MySQL 中不推荐使用大量的触发器以及复杂的存储过程。
table_open_cache_instances 设置为 1 时，在高并发下会影响 SQL 的执行效率。本案例的从库并发量不高，其他场景请根据实际情况进行调整。
触发器越多会导致 memory/sql/sp_head::main_mem_root 占用的内存越大，存储过程所使用的内存也会越大。
本文只是给出了解决内存溢出的一个方向，具体的底层原理请自行探索。

先清空缓存再访问表，查看缓存

更多技术文章，请访问：https://opensource.actionsky.com/

关于 SQLE

SQLE 是一款全方位的 SQL 质量管理平台，覆盖开发至生产环境的 SQL 审核和管理。支持主流的开源、商业、国产数据库，为开发和运维提供流程自动化能力，提升上线效率，提高数据质量。

SQLE 获取

类型	地址
版本库	https://github.com/actiontech/sqle
文档	https://actiontech.github.io/sqle-docs/
发布信息	https://github.com/actiontech/sqle/releases
数据审核插件开发文档	https://actiontech.github.io/sqle-docs/docs/dev-manual/plugins/howtouse

微信关注我们

原文链接：https://my.oschina.net/actiontechoss/blog/11046995

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

RDS for MariaDB“智能DBA助手”，让运维效率嗖嗖地！

本文分享自华为云社区《RDS for MariaDB“智能DBA助手”，让运维效率嗖嗖地！》，作者：GaussDB 数据库。技术背景无论是日常运维还是紧急场景下的问题定位，DBA都需要对数据库实例的运行情况有全面的感知。客户购买数据库实例后，想要判断其运行状态，往往需要在监控、告警、实例管理等多个页面之间跳转才能获取完整的实例状态信息，运维过程繁重且效率低下。 RDS for MariaDB的实例状态概览功能，可以实现上述关键运维信息的智能聚合展示，帮助客户快速感知数据库实例的整体健康度，并迅速定位异常，极大简化了运维操作。 RDS for MariaDB实例功能概览 RDS for MariaDB实例概览功能分为多个模块，包括告警统计、资源使用情况、重点性能指标和健康智能诊断模块：告警统计模块：查看实例运行中最近七天，所有等级的告警条数。资源使用情况模块：查看实例的CPU利用率、内存利用率和磁盘利用率等资源相关指标。重点性能指标模块：查看实例最近一小时的重点性能指标。健康智能诊断模块：查看基于运行数据的实例健康情况自动诊断结果。通过“实例详情”->“智能DBA...

2024-03-12

433

背景 GreptimeDB 是一款采用共享存储架构的分布式时序数据库，其底层存储支持对象存储，可实现 50 倍成本节省。在 GreptimeDB 的分布式版本中，包含以下三种节点角色：MetaSrv ，Datanode 和 Frontend。 MetaSrv 管理着数据库和表的元信息，包括数据表分区在集群中的分布、请求的路由地址等信息。 Datanode 负责存储集群中的表分区（Region）数据，接收并执行从 Frontend 发来的读写请求。 Frontend 为无状态组件，可以根据需求进行伸缩扩容。其主要职责包括接收请求并进行鉴权，将多种协议转换为 GreptimeDB 集群的内部协议，并根据元数据将请求转发到相应的 Datanode 节点。 Region Migration 自 v0.6.0 起，GreptimeDB 分布式版本具备了将 Datanode 上的表分区（Region）数据迁移到另一个 Datanode 的能力。GreptimeDB 采用了共享存储（Shared Storage）架构，其中数据文件存储在对象存储上，并在多个 Datanode 之间共享。因此，Reg...

2024-03-12

387

资源下载

更多资源

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

如何解决由触发器导致 MySQL 内存溢出？

问题现象

排查过程

基本信息

当 `table_open_cache_instances` 为 8 时：

当 `table_open_cache_instances` 为 1 时：

总结

关于 SQLE

SQLE 获取

RDS for MariaDB“智能DBA助手”，让运维效率嗖嗖地！

Region Migration 技术原理 — 共享存储架构下的高效数据迁移策略

相关文章

发表评论

资源下载

Spring

Rocky Linux

Sublime Text

WebStorm

欢迎您来访！

如何解决由触发器导致 MySQL 内存溢出？

问题现象

排查过程

基本信息

当 table_open_cache_instances 为 8 时：

当 table_open_cache_instances 为 1 时：

总结

关于 SQLE

SQLE 获取

RDS for MariaDB“智能DBA助手”，让运维效率嗖嗖地！

Region Migration 技术原理 — 共享存储架构下的高效数据迁移策略

相关文章

发表评论

资源下载

Spring

Rocky Linux

Sublime Text

WebStorm

欢迎您来访！

当 `table_open_cache_instances` 为 8 时：

当 `table_open_cache_instances` 为 1 时：