Mysql Join语句执行流程-低调大师

Mysql Join语句执行流程

2020-02-13 753

今天我们来看一下join语句的执行流程

JOIN主要使用 Index Nested-Loop Join 和 Block Nested-Loop Join 算法实现

Index Nested-Loop Join

如果 join on 相关的字段存在索引就使用 Index Nested-Loop Join 算法来进行关联

如下sql语句的执行过程：

select * from t1 join t2 on (t1.a=t2.a);

对驱动表 t1 做了全表扫描，这个过程需要扫描 100 行;
而对于每一行 R，根据 a 字段去表 t2 查找，走的是树搜索过程。由于我们构造的数据都是一一对应的，因此每次的搜索过程都只扫描一行，也是总共扫描 100 行;
所以，整个执行流程，总扫描行数是 200。

假设不使用 join，那我们就只能用单表查询。我们看看上面这条语句的需求，用单表查询怎么实现。

执行select * from t1，查出表 t1 的所有数据，这里有 100 行;
循环遍历这 100 行数据: 从每一行 R 取出字段 a 的值 $R.a; 执行select * from t2 where a=$R.a; 把返回的结果和 R 构成结果集的一行。

可以看到，在这个查询过程，也是扫描了 200 行，但是总共执行了 101 条语句，比直接 join 多了 100 次交互。除此之外，客户端还要自己拼接 SQL 语句和结果

显然，这么做还不如直接 join 好。

怎么选择驱动表?

假设驱动表的行数是 N，执行过程就要扫描驱动表 N 行，然后对于每一行，到被驱动表上匹配一次

因此整个执行过程，近似复杂度是 N + N2log2M。显然，N 对扫描行数的影响更大，因此应该让小表来做驱动表

结论：

使用 join 语句，性能比强行拆成多个单表执行 SQL 语句的性能要好;
如果使用 join 语句的话，需要让小表做驱动表。

但是，你需要注意，这个结论的前提是“可以使用被驱动表的索引”。

Block Nested-Loop Join

如果关联语句中没有索引的话可能需要扫描 N*M 行当然Mysql对此有一个优化算法

算法的流程是这样的:

把表 t1 的数据读入线程内存 join_buffer 中，由于我们这个语句中写的是 select *，因此是把整个表 t1 放入了内存;
扫描表 t2，把表 t2 中的每一行取出来，跟 join_buffer 中的数据做对比，满足 join 条件的，作为结果集的一部分返回。

Block Nested-Loop Join 算法的这 N*M 次判断是内存操作，速度上会快很多，性能也更好

接下来，我们来看一下，在这种情况下，应该选择哪个表做驱动表。

两个表都做一次全表扫描，所以总的扫描行数是 M+N;
内存中的判断次数是 M*N。

可以看到，调换这两个算式中的 M 和 N 没差别，因此这时候选择大表还是小表做驱动表，执行耗时是一样的。

join_buffer 放不下怎么办

如果放不下表 t1 的所有数据话，策略很简单，就是分段放

执行过程就变成了:

扫描表 t1，顺序读取数据行放入 join_buffer 中，放完第 88 行 join_buffer 满了，继续第 2 步;
扫描表 t2，把 t2 中的每一行取出来，跟 join_buffer 中的数据做对比，满足 join 条件的，作为结果集的一部分返回;
清空 join_buffer;
继续扫描表 t1，顺序读取最后的 12 行数据放入 join_buffer 中，继续执行第 2 步

假设，驱动表的数据行数是 N，需要分 K 段才能完成算法流程，被驱动表的数据行数是 M。注意，这里的 K 不是常数，N 越大 K 就会越大，因此把 K 表示为λ*N，显然λ的取值范围是 (0,1)。所以，在这个算法的执行过程中:

扫描行数是 N+λ* N*M;
内存判断 N*M 次。

显然，内存判断次数是不受选择哪个表作为驱动表影响的。而考虑到扫描行数，在 M和 N大小确定的情况下，N小一些，整个算式的结果会更小。

所以结论是，应该让小表当驱动表。

这里我需要说明下，什么叫作“小表”。

在决定哪个表做驱动表的时候，应该是两个表按照各自的条件过滤，过滤完成之后，计算参与 join 的各个字段的总数据量，数据量小的那个表，就是“小表”，应该作为驱动表

join语句怎么优化

Multi-Range Read 优化

在介绍 join 语句的优化方案之前，我需要先介绍一个知识点，即:Multi-Range Read 优化 (MRR)。这个优化的主要目的是尽量使用顺序读盘

因为大多数的数据都是按照主键递增顺序插入得到的，所以我们可以认为，如果按照主键的递增顺序查询的话，对磁盘的读比较接近顺序读，能够提升读性能

这，就是 MRR 优化的设计思路。此时，语句的执行流程变成了这样:

根据索引 a，定位到满足条件的记录，将 id 值放入 read_rnd_buffer 中 ; 2. 将 read_rnd_buffer 中的 id 进行递增排序;
排序后的 id 数组，依次到主键 id 索引中查记录，并作为结果返回。

另外需要说明的是，如果你想要稳定地使用 MRR 优化的话，需要设置

set optimizer_switch="mrr_cost_based=off"

MRR 能够提升性能的核心在于，这条查询语句在索引 a 上做的是一个范围查询可以得到足够多的主键 id。这样通过排序以后，再去主键索引查数据，才能体现出“顺序性”的优势

Batched Key Access

这个 Batched Key Access （BKA），其实就是对 NLJ 算法的优化

NLJ 算法执行的逻辑是:从驱动表 t1，一行行地取出 a 的值，再到被驱动表 t2 去做 join。也就是说，对于表 t2 来说，每次都是匹配一个值。这时，MRR 的优势就用不上了

那怎么才能一次性地多传些值给表 t2呢?方法就是，从表 t1 里一次性地多拿些行出来，一起传给表 t2。既然如此，我们就把表t1 的数据取出来一部分，先放到 join_buffer。我们知道 join_buffer 在 BNL 算法里的作用，是暂存驱动表的数据。但是在 NLJ 算法里并没有用。那么，我们刚好就可以复用 join_buffer 到 BKA 算法中。

如果要使用 BKA 优化算法的话，你需要在执行 SQL 语句之前，先设置

set optimizer_switch='mrr=on,mrr_cost_based=off,batched_key_access=on';

BNL 算法的性能问题

大表 join 操作虽然对 IO 有影响，但是在语句执行结束后，对 IO 的影响也就结束了。但是，对 Buffer Pool 的影响就是持续性的，需要依靠后续的查询请求慢慢恢复内存命中率

为了减少这种影响，你可以考虑增大 join_buffer_size 的值，减少对被驱动表的扫描次数。

也就是说，BNL 算法对系统的影响主要包括三个方面:

可能会多次扫描被驱动表，占用磁盘 IO 资源;
判断 join 条件需要执行 M*N 次对比(M、N 分别是两张表的行数)，如果是大表就会占用非常多的 CPU 资源;
可能会导致 Buffer Pool 的热数据被淘汰，影响内存命中率

我们执行语句之前，需要通过理论分析和查看 explain 结果的方式，确认是否要使用 BNL 算法。如果确认优化器会使用 BNL 算法，就需要做优化。优化的常见做法是，给被驱动表的 join 字段加上索引，把 BNL 算法转成 BKA 算法

hash join

如果 join_buffer 里面维护的不是一个无序数组，而是一个哈希表的话，那么就不是 10 亿次判断，而是 100 万次 hash 查找。这样的话，整条语句的执行速度就快多了吧?

实际上，这个优化思路，我们可以自己实现在业务端。实现流程大致如下:

select * from t1;取得表 t1 的全部 1000 行数据，在业务端存入一个 hash 结构
select * from t2 where b>=1 and b<=2000; 获取表 t2 中满足条件的 2000 行数据。
把这 2000 行数据，一行一行地取到业务端，到 hash 结构的数据表中寻找匹配的数据。满足匹配的条件的这行数据，就作为结果集的一行。

微信关注我们

原文链接：https://my.oschina.net/jayqqaa12/blog/3165872

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

DataGrip 2019.3.3 发布，多引擎数据库环境

DataGrip 2019.3.3 发布了，这是 2019.3 系列的第 3 个 bug 修复更新，主要修复内容包括：将外键约束添加到表时，将使用正确的 schema。DBE-9743 执行 DROP 后再执行 CREATE 语句后，才会自动同步。DBE-9980 JOIN 补全不再冻结。DBE-9844 [Oracle] OracleSqlPlus 方言又回来了。DBE-10030 [ClickHouse]删除行按预期工作。 [BigQuery]标识符使用反引号引起来。 [BigQuery]打开表的数据时会生成LIMIT 和OFFSET。更新说明： https://blog.jetbrains.com/datagrip/2020/02/13/datagrip-2019-3-3

2020-02-13

978

前言自从Oracle收购Sun之后，对Java收费或加强控制的尝试从未间断，谷歌与Oracle围绕Java API的官司也跌宕起伏。虽然Oracle只是针对Oracle JDK8的升级收费，并释放了OpenJDK一直开源这份善意，但是如果没有各个大非Oracle的JVM、JDK和众多其它基于JVM的语言，Oracle这份善意能维持到什么时候可不好说。大厂要从JVM和JDK的层面早做打算，而广大中小企业，就只能先从Java语言的层面，先找到Oracle以外的备胎。自从被谷歌钦定为Android开发首选语言之后，采用Apache2.0License的Kotlin逐渐进入大众的视野。从领域语言到通用语言，基于JVM的语言选择众多，Kotlin能脱颖而出被谷歌相中，除了License的友好外，自然有其独到之处（个人觉得基于Python语法的Jython在当时也算是一个强强联合的选择，当然现在来看Kotlin的优势明显）。我们先从摘自网上的一个段子来感受下Kotlin的特点： Scala：想解决Java表达能力不足的问题 Groovy：想解决Java语法过于冗长的问题 Clojure：想解决...

2020-02-13

660

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。