慢查询日志中的 Lock_time 从哪里来?
研究 Lock_time 之前,我对它的了解,仅限于它表示锁等待时间。至于它包含哪些锁等待时间、怎么计算得到的,我并不清楚。
所以,我一直有个困惑:为什么有些 SQL 执行时间很长,Lock_time 却很小(例如:0.001 秒)?
今天我们就一起来看看,Lock_time 包含哪些锁等待时间、以及是怎么计算得到的?
本文基于 MySQL 8.0.32 源码,存储引擎为 InnoDB。
目录
-
1. 整体介绍
-
2. 表锁等待时间
-
3. 行锁等待时间
-
4. 累计时间
-
5. lock_time
-
6. 总结
正文
1. 整体介绍
Lock_time 由两部分相加得到:
-
表锁等待时间,如果 SQL 中包含多个表,则是多个表锁等待时间之和。
-
行锁等待时间,如果 SQL 执行过程中需要对多条记录加锁,则是多个行锁等待时间之和。
对 InnoDB 来说,DML、DQL 对记录进行增删改查操作时,如需加锁,都是加行级别的共享锁、排他锁,而不加表级别的共享锁、排他锁。
共享锁又称作 S 锁,排他锁又称作 X 锁。
那么,InnoDB 有表级别的共享锁、排他锁吗?
别说,还真有!
不过,不常有!
只有执行 LOCK TABLES ... [READ | WRITE],并且系统变量 innodb_table_locks = 1、auto_commit = 0,InnoDB 才会加表级别的共享锁、排他锁。
从代码注释和官方文档对
innodb_table_locks
的介绍来看,执行存储过程和触发器时,InnoDB 也可能会加表级别的共享锁、排他锁,我们就不展开介绍了。
如果 InnoDB 加了表级别的共享锁、排他锁,Lock_time 包含表锁等待时间,我们比较好理解。
如果我们执行 DML、DQL,InnoDB 没有加表级别的共享锁、排他锁,Lock_time 里还包含表锁等待时间吗?
这个问题,就得看用什么标准了:
-
严格来说,Lock_time 就不包含表锁等待时间了。
-
不严格来说,Lock_time 还是包含表锁等待时间的(InnoDB 采用了这个标准)。
接下来,我们通过源码,进入表锁、行锁等待时间的实现逻辑,来一睹芳容。
2. 表锁等待时间
我们先来看一下表锁等待时间实现逻辑的堆栈:
| > mysql_execute_command(THD*, bool) sql/sql_parse.cc:4688
| + > Sql_cmd_dml::execute(THD*) sql/sql_select.cc:574
| + - > lock_tables(...) sql/sql_base.cc:6899
| + - x > mysql_lock_tables(...) sql/lock.cc:337
| + - x = > lock_external(THD*, TABLE**, unsigned int) sql/lock.cc:393
| + - x = | > handler::ha_external_lock(THD*, int) sql/handler.cc:7841
| + - x = | + > ha_innobase::external_lock(THD*, int) storage/innobase/handler/ha_innodb.cc:18869
Sql_cmd_dml::execute() 调用 lock_tables() 对多个表加锁。
// sql/sql_base.cc
bool lock_tables(THD *thd, Table_ref *tables, uint count, uint flags) {
...
if (!thd->locked_tables_mode) {
...
if (!(thd->lock =
mysql_lock_tables(thd, start, (uint)(ptr - start), flags)))
return true;
...
}
...
}
lock_tables() 调用 mysql_lock_tables() 对多个表加锁。
// sql/lock.cc
MYSQL_LOCK *mysql_lock_tables(THD *thd, TABLE **tables, size_t count,
uint flags) {
...
// 记录开始时间
ulonglong lock_start_usec = my_micro_time();
...
if (sql_lock->table_count &&
lock_external(thd, sql_lock->table, sql_lock->table_count)) {
/* Clear the lock type of all lock data to avoid reusage. */
reset_lock_data_and_free(&sql_lock);
goto end;
}
...
// lock_external() 执行完成之后
// 当前时间减去开始时间
// 就是表锁等待时间
ulonglong lock_end_usec = my_micro_time();
thd->inc_lock_usec(lock_end_usec - lock_start_usec);
...
}
mysql_lock_tables() 调用 lock_external() 之前,先把当前时间记录下来,作为表锁等待的开始时间。
然后调用 lock_external() 对多个表加锁。
最后,调用 thd->inc_lock_usec() 把表锁等待时间累加到 server 层线程对象(thd)的 m_lock_usec 属性中。
// sql/lock.cc
static int lock_external(THD *thd, TABLE **tables, uint count) {
...
// 循环 SQL 中的表
for (i = 1; i <= count; i++, tables++) {
assert((*tables)->reginfo.lock_type >= TL_READ);
// 默认锁类型为写锁
// 对应到 InnoDB 的锁类型就是排他锁(X)
lock_type = F_WRLCK; /* Lock exclusive */
// 如果以只读方式打开表的数据文件(.ibd)或者
// lock_type 大于等于 TL_READ(2) 并且
// lock_type 小于等于 TL_READ_NO_INSERT(5)
// 则说明是只读操作,加读锁
// 对应到 InnoDB 的锁类型就是共享锁(S)
if ((*tables)->db_stat & HA_READ_ONLY ||
((*tables)->reginfo.lock_type >= TL_READ &&
(*tables)->reginfo.lock_type <= TL_READ_NO_INSERT))
lock_type = F_RDLCK;
if ((error = (*tables)->file->ha_external_lock(thd, lock_type))) {
// ha_external_lock() 返回非 0 值
// 说明执行 ha_external_lock() 方法出现了错误
// 这里处理善后工作
...
return error;
} else {
(*tables)->db_stat &= ~HA_BLOCK_LOCK;
(*tables)->current_lock = lock_type;
}
}
return 0;
}
lock_external() 会迭代 SQL 中的表,每迭代一个表,都调用 ha_external_lock() 对表进行加锁。
// sql/handler.cc
int handler::ha_external_lock(THD *thd, int lock_type) {
...
MYSQL_TABLE_LOCK_WAIT(PSI_TABLE_EXTERNAL_LOCK, lock_type,
{ error = external_lock(thd, lock_type); })
...
}
handler::ha_external_lock() 调用表对应存储引擎的 external_lock() 方法。
对 InnoDB 来说,调用的是 ha_innobase::external_lock()
,这个方法的代码比较多,算是个大杂烩,可以分为三类:
-
加表级别的共享锁、排他锁。
-
把当前迭代表所属表空间的脏页,同步刷新到磁盘。
-
一些初始化逻辑(执行快,花费时间极少)。
ha_innobase::external_lock() 的执行时间会计入表锁等待时间,因为其中可能包含同步刷脏页操作、执行一些初始化逻辑花费的时间,所以,表锁等待时间并不纯粹。
对需要加表锁的 SQL 来说,表锁等待时间包含两部分:
-
加表级别的共享锁、排他锁的等待时间。
-
执行一些初始化逻辑花费的时间。
如果是 FLUSH TABLES ... WITH READ LOCK 语句,表锁等待时间还包含:把其中涉及的表所属表空间的脏页同步刷新到磁盘所花费的时间。
对不需要加表锁的 SQL 来说,表锁等待时间就是执行 ha_innobase::external_lock() 中一些初始化逻辑花费的时间。
我们来看看 ha_innobase::external_lock() 主要包含哪些代码逻辑,对这部分细节不感兴趣的读者,可以跳过这个小节。
这个小节的代码都来自于
ha_innobase::external_lock()
,文件路径storage/innobase/handler/ha_innodb.cc
。
update_thd(thd);
以上代码,创建 InnoDB 的事务对象(trx_t),保存到 server 层的用户线程对象(thd)中。
// lock_type == F_WRLCK,意味着需要加写锁
// 这里用于表示需要记录 binlog
if (lock_type == F_WRLCK &&
// 表示不支持 STATEMENT 格式的 binlog
// table_flags() 方法会判断事务隔离级别
!(table_flags() & HA_BINLOG_STMT_CAPABLE) &&
// 系统变量 binlog_format = STATEMENT
// 表示用户需要记录 STATEMENT 格式的 binlog
thd_binlog_format(thd) == BINLOG_FORMAT_STMT &&
// 表示需要为当前连接指定的数据库记录 binlog
// use <db> 或者连接数据库时指定了数据库
thd_binlog_filter_ok(thd) &&
// 表示当前执行的 SQL 会产生 ROW 格式的 binlog
thd_sqlcom_can_generate_row_events(thd)) {
bool skip = false;
...
if (!skip) {
...
return HA_ERR_LOGGING_IMPOSSIBLE;
}
}
上面代码的判断条件有点多,我们用一句话来概括一下代码逻辑:
事务隔离级别为 READ_UNCOMMITTED
、READ_COMMITTED
时,如果 SQL 会产生 ROW
格式的 binlog,而用户设置系统变量 binlog_format 的值为 STATEMENT
,要求记录 STATEMENT 格式的 binlog,ha_innobase::external_lock() 会返回 HA_ERR_LOGGING_IMPOSSIBLE
,因为 MySQL 无法处理这样矛盾的场景。
if (lock_type == F_WRLCK) {
/* If this is a SELECT, then it is in UPDATE TABLE ...
or SELECT ... FOR UPDATE */
m_prebuilt->select_lock_type = LOCK_X;
m_stored_select_lock_type = LOCK_X;
}
InnoDB 读取记录时,会根据 m_prebuilt->select_lock_type
的值确定是否加行锁
、加共享锁还是排他锁。
lock_type 等于 F_WRLCK,表示 server 层要求加写锁,对应到 InnoDB 的锁类型,就是排他锁,设置加锁类型为 LOCK_X。
if (lock_type == F_RDLCK) {
...
// 如果当前表是数据字典表
// 或者被标识为不需要加锁(no_read_locking = true)
// 设置加锁类型为 LOCK_NONE
if (m_prebuilt->table->is_dd_table || m_prebuilt->no_read_locking) {
m_prebuilt->select_lock_type = LOCK_NONE;
m_stored_select_lock_type = LOCK_NONE;
// 如果事务隔离级别是可串行化
} else if (trx->isolation_level == TRX_ISO_SERIALIZABLE &&
// 并且当前 SQL 还没有确定加锁类型
m_prebuilt->select_lock_type == LOCK_NONE &&
// 并且当前事务需要手动提交
thd_test_options(thd, OPTION_NOT_AUTOCOMMIT | OPTION_BEGIN)) {
// 设置加锁类型为共享锁
m_prebuilt->select_lock_type = LOCK_S;
m_stored_select_lock_type = LOCK_S;
} else {
// Retain value set earlier for example via store_lock()
// which is LOCK_S or LOCK_NONE
ut_ad(m_prebuilt->select_lock_type == LOCK_S ||
m_prebuilt->select_lock_type == LOCK_NONE);
}
}
lock_type 等于 F_RDLCK,表示 server 层要求加读锁,对应到 InnoDB 的锁类型,就是共享锁,分两种情况设置 InnoDB 的加锁类型:
-
对于 ACL 表,
m_prebuilt->no_read_locking
会被设置为 true,表示读取记录时不加锁
。 -
如果事务隔离级别是可串行化,并且当前事务需要手动执行 COMMIT 语句提交,以及还没有确定读取该表记录时加什么类型的行锁,设置 InnoDB 加锁类型为
共享锁
。
ACL 表用于访问权限控制,包含如下这些表:
-
user -
db -
tables_priv -
columns_priv -
procs_priv -
proxies_priv -
role_edges -
default_roles -
global_grants -
password_history
switch (m_prebuilt->table->quiesce) {
case QUIESCE_START:
/* Check for FLUSH TABLE t WITH READ LOCK; */
if (!srv_read_only_mode && sql_command == SQLCOM_FLUSH &&
lock_type == F_RDLCK) {
...
row_quiesce_table_start(m_prebuilt->table, trx);
...
}
break;
...
}
只有执行 FLUSH TABLES ... WITH READ LOCK 语句时,才会命中代码中的 case 分支。
row_quiesce_table_start() 会调用 buf_LRU_flush_or_remove_pages()
,并把当前加表锁的表所属表空间对象传给该方法,表示把该表空间的脏页刷新到磁盘。
3. 行锁等待时间
我们先来看看对一条记录加行锁的等待时间是怎么计算的。
InnoDB 读取一条记录时,如需加行锁,会调用 sel_set_rec_lock() 进行加锁。
如果其它事务持有该记录的行锁,sel_set_rec_lock()
会返回 DB_LOCK_WAIT,row_search_mvcc()
调用 row_mysql_handle_errors() 处理锁等待逻辑。
row_mysql_handle_errors() 调用 lock_wait_suspend_thread()
,行锁等待逻辑由这个方法实现。
// storage/innobase/lock/lock0wait.cc
void lock_wait_suspend_thread(que_thr_t *thr) {
srv_slot_t *slot;
trx_t *trx;
// 声明变量,用于保存行锁等待的开始时间
std::chrono::steady_clock::time_point start_time;
...
if (thr->lock_state == QUE_THR_LOCK_ROW) {
srv_stats.n_lock_wait_count.inc();
srv_stats.n_lock_wait_current_count.inc();
// 设置行锁等待的开始时间
start_time = std::chrono::steady_clock::now();
}
...
// 等待行锁
os_event_wait(slot->event);
...
// 运行到这里,有两种情况:
// 1. 锁等待超时
// 2. 已经获取到行锁
if (thr->lock_state == QUE_THR_LOCK_ROW) {
// 用当前时间减去行锁等待的开始时间
// 就是一条记录的行锁等待时间
const auto diff_time = std::chrono::steady_clock::now() - start_time;
...
/* Record the lock wait time for this thread */
// 累加线程的行锁等待时间
// 保存到 mysql_thd 线程中
// mysql_thd 是 server 层的线程
thd_set_lock_wait_time(trx->mysql_thd, diff_time);
...
}
...
}
从上面代码可以看到,计算一条记录的行锁等待时间,逻辑比较简单:
先保存当前行锁等待的开始时间,获取到行锁或等待行锁超时之后,再用当前时间减去开始时间,就得到了一条记录的行锁等待时间。
4. 累计时间
一滴水的梦想是终有一天能够汇入大海。
表锁、行锁等待时间的归宿是累加起来,最终成为 lock_time,这个过程是通过调用 thd_set_lock_wait_time()
实现的。
// storage/innobase/handler/ha_innodb.cc
void thd_set_lock_wait_time(THD *thd,
std::chrono::steady_clock::duration value) {
if (thd) {
thd_storage_lock_wait(
thd,
std::chrono::duration_cast<std::chrono::microseconds>(value).count());
}
}
thd_set_lock_wait_time() 调用 thd_storage_lock_wait()
累加表锁、行锁等待时间。
// sql/sql_thd_api.cc
void thd_storage_lock_wait(MYSQL_THD thd, long long value) {
thd->inc_lock_usec(value);
}
真正干活的是 THD::inc_lock_usec() 方法。
// sql/sql_class.cc
void THD::inc_lock_usec(ulonglong lock_usec) {
m_lock_usec += lock_usec;
MYSQL_SET_STATEMENT_LOCK_TIME(m_statement_psi, m_lock_usec);
}
server 层每获取到一个表锁,都会调用 thd_set_lock_wait_time()
,累加表锁等待时间。
最终会调用 THD::inc_lock_usec() 把表锁等待时间累加到 server 层的线程对象 thd 的 m_lock_usec 属性中。
InnoDB 每获取到一条记录的行锁,或者行锁等待超时,都会调用 thd_set_lock_wait_time()
,累加行锁等待时间。
最终会调用 THD::inc_lock_usec() 把行锁等待时间累加到 server 层的线程对象 thd 的 m_lock_usec 属性中。
5. lock_time
SQL 执行完成之后,dispatch_command() 调用 log_slow_statement() 记录慢查询到文件中。
log_slow_statement() 也不是真正干活的,经过多级,最终调用 Query_logger::slow_log_write() 记录慢查询到文件中。
// sql/log.cc
bool Query_logger::slow_log_write(THD *thd, const char *query,
size_t query_length, bool aggregate,
ulonglong lock_usec, ulonglong exec_usec) {
...
if (aggregate) {
query_utime = exec_usec;
lock_utime = lock_usec;
} else if (thd->start_utime) {
query_utime = (current_utime - thd->start_utime);
lock_utime = thd->get_lock_usec();
} else {
query_utime = 0;
lock_utime = 0;
}
...
bool error = false;
for (Log_event_handler **current_handler = slow_log_handler_list;
*current_handler;) {
error |= (*current_handler++)->log_slow(
thd, current_utime,
(thd->start_time.tv_sec * 1000000ULL) +
thd->start_time.tv_usec,
user_host_buff, user_host_len, query_utime,
lock_utime, is_command, query, query_length);
}
...
}
Query_logger::slow_log_write() 被调用时,参数 aggregate
的值都是 false,上面代码不会进入 if (aggregate)
分支。
if (thd->start_utime)
分支,lock_utime = thd->get_lock_usec(),从当前线程对象(thd)中获取之前累加的表锁、行锁等待时间。
然后,调用 log_slow() 记录慢查询到文件中。
// sql/log.cc
bool Log_to_file_event_handler::log_slow(
THD *thd, ulonglong current_utime, ulonglong query_start_utime,
const char *user_host, size_t user_host_len, ulonglong query_utime,
ulonglong lock_utime, bool is_command, const char *sql_text,
size_t sql_text_len) {
if (!mysql_slow_log.is_open()) return false;
Silence_log_table_errors error_handler;
thd->push_internal_handler(&error_handler);
bool retval = mysql_slow_log.write_slow(
thd, current_utime, query_start_utime, user_host, user_host_len,
query_utime, lock_utime, is_command, sql_text, sql_text_len);
thd->pop_internal_handler();
return retval;
}
Log_to_file_event_handler::log_slow() 最终调用 mysql_slow_log.write_slow() 记录慢查询到文件中。
// sql/log.cc
bool File_query_log::write_slow(...) {
...
if (!thd->copy_status_var_ptr) {
if (my_b_printf(&log_file,
"# Query_time: %s Lock_time: %s"
" Rows_sent: %lu Rows_examined: %lu\n",
query_time_buff, lock_time_buff,
(ulong)thd->get_sent_row_count(),
(ulong)thd->get_examined_row_count()) == (uint)-1)
goto err; /* purecov: inspected */
}
...
}
经常看慢查询日志的读者,想必对这 2 行会非常熟悉:
Query_time: %s Lock_time: %s
Rows_sent: %lu Rows_examined: %lu
其中的 Lock_time 就是本文的主题,介绍到这里,总算是和文章标题遥相呼应上了。
6. 总结
Lock_time 由表锁、行锁等待时间相加得到。
表锁等待时间并不纯粹,其中包含执行一些初始化操作花费的时间。
对 FLUSH TABLES ... WITH READ LOCK 语句来说,还包含把其中涉及的表所属表空间的脏页同步刷新到磁盘所花费的时间。
行锁等待时间很纯粹,就是多条记录的行锁等待时间之和,或者一条记录的行锁等待时间。
以上就是本文的全部内容了,如果本文对你有所帮助,还请帮忙 转发朋友圈、点赞、在看,谢谢 ^_^
有想了解的 MySQL 知识点或想交流的问题可以 加我微信
公众号:一树一溪 | 我的微信:csch52 |
故障分析 | innodb_thread_concurrency 导致数据库异常的问题分析
技术分享 | 一招解决 MySQL 中 DDL 被阻塞的问题
故障分析 | 一条本该记录到慢日志的 SQL 是如何被漏掉的
关于 SQLE
爱可生开源社区的 SQLE 是一款面向数据库使用者和管理者,支持多场景审核,支持标准化上线流程,原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。
SQLE 获取
类型 | 地址 |
---|---|
版本库 | https://github.com/actiontech/sqle |
文档 | https://actiontech.github.io/sqle-docs-cn/ |
发布信息 | https://github.com/actiontech/sqle/releases |
数据审核插件开发文档 | https://actiontech.github.io/sqle-docs-cn/3.modules/3.7_auditplugin/auditplugin_development.html |
本文分享自微信公众号 - 爱可生开源社区(ActiontechOSS)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Opera 浏览器集成原生 AI 助手“Aria
Opera Software 宣布将 AI 助手“Aria”集成到其网络浏览器中。 Aria 基于 OpenAI 技术,原生内置于新版 Opera One 浏览器和 Opera for Android 浏览器中,在包括欧洲在内的 180 多个国家/地区可用。 Opera Software 称 Aria 对 ChatGPT 的实现包括实时搜索互联网的能力,这点和 Bing Chat 相似。但 Opera Software 为 Aria 添加了更多特定于浏览器的功能。比如 Aria 了解 Opera浏览器的全部支持文档,遇到问题的 Opera 用户可以向 Aria 询问相关问题,将很快得到准确的答复。 该功能感觉和微软即将在 Windows 11 上推出的 Windows Copilot 有点像。同样是非常熟悉内部文档,因此在面对问题的时候可快速响应。 “Aria”基于 Opera自家的“Composer”基础架构,允许 Aria 连接到多个 AI 模型,进一步扩展其功能。 在 4 月底, Opera Software 宣布使用新版Opera One 浏览器代替老版本的Opera 浏览器,...
- 下一篇
教你1分钟搞定2小时字幕
摘要:本文将介绍如何使用录音文件识别极速版给无字幕视频自动生成字幕。 本文分享自华为云社区《利用录音文件极速版为视频生成字幕》,作者:戈兀。 引言 越来越多的人们使用抖音、B站等视频app,记录、分享日常生活,随之互联网上产生了大量的长、短视频。字幕是影响视频观看体验的重要因素。以日常分享为主的视频创作者往往没有时间为视频制作字幕,在创作者发音不清楚的前提下,没有字幕的视频可能会让观众困惑甚至产生理解偏差。而带字幕的视频让观众有更好的观看体验,“一气呵成”顺畅地看完。 语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。随着深度学习的发展,端到端语音识别技术也取得了巨大的突破。将原始的音频数据,经过分帧、加窗、FFT等操作后,得到描述音频在时、频域信息的梅尔特征或是Fbank特征。将特征送入transformer等神经网络,输出对应的文本信息。此外,由大量文本训练的语言模型(language model)能够纠正语音识别输出文本不通顺的问题,改善阅读体验。而热词技术也被用来解决语音识别的领域适配问题,如同音不同字。 本文将介绍如何使...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- 2048小游戏-低调大师作品
- CentOS8编译安装MySQL8.0.19
- Hadoop3单机部署,实现最简伪集群
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Linux系统CentOS6、CentOS7手动修改IP地址