Mysql高级-sql分析及优化（二）-低调大师

Mysql高级-sql分析及优化（二）

2020-11-22 624

三、优化SQL步骤

1、查看SQL执行频率

MySQL 客户端连接成功后，通过 show [session|global] status 命令可以提供服务器状态信息。show [session|global] status 可以根据需要加上参数“session”或者“global”来显示 session 级（当前连接）的计结果和global 级（自数据库上次启动至今）的统计结果。如果不写，默认使用参数是“session”。下面的命令显示了当前 session 中所有统计参数的值：

show status like 'Com_______';
/**
Com_xxx 表示每个 xxx 语句执行的次数，我们通常比较关心的是以下几个统计参数。
Com_select 执行 select 操作的次数，一次查询只累加 1。
Com_insert 执行 INSERT 操作的次数，对于批量插入的 INSERT 操作，只累加一次。
Com_update 执行 UPDATE 操作的次数。
Com_delete 执行 DELETE 操作的次数。
Com_*** : 这些参数对于所有存储引擎的表操作都会进行累计。
**/
show status like 'Innodb_rows_%';
/**
Innodb_*** : 这几个参数只是针对InnoDB 存储引擎的，累加的算法也略有不同。
关心参数
Innodb_rows_read select 查询返回的行数。
Innodb_rows_inserted 执行 INSERT 操作插入的行数。
Innodb_rows_updated 执行 UPDATE 操作更新的行数。
Innodb_rows_deleted 执行 DELETE 操作删除的行数。
/**
另外还有以下几个关心参数：
Connections 试图连接 MySQL 服务器的次数。
Uptime 服务器工作时间。
Slow_queries 慢查询的次数。

2、定位低效率执行sql

2.1 慢查询日志 :

通过慢查询日志定位那些执行效率较低的 SQL 语句，用--log-slow-queries[=file_name]选项启动时，mysqld 写一个包含所有执行时间超过 long_query_time 秒的 SQL 语句的日志文件。

2.2 show processlist :

慢查询日志在查询结束以后才纪录，所以在应用反映执行效率出现问题的时候查询慢查询日志并不能定位问题，可以使用show processlist命令查看当前MySQL在进行的线程，包括线程的状态、是否锁表等，可以实时地查看 SQL 的执行情况，同时对一些锁表操作进行优化。

3、explain分析执行计划

通过以上步骤查询到效率低的 SQL 语句后，可以通过 EXPLAIN或者 DESC命令获取 MySQL如何执行 SELECT 语句的信息，包括在 SELECT 语句执行过程中表如何连接和连接的顺序。查询SQL语句的执行计划：

explain select * from tb_1 item where id = 1;
查询出来的表结构如下图所示：

4、 show profile分析SQL

Mysql从5.0.37版本开始增加了对 show profiles 和 show profile 语句的支持。show profiles 能够在做SQL优化时帮助我们了解时间都耗费到哪里去了。

通过 have_profiling 参数，能够看到当前MySQL是否支持profile：select @@have_profiling

默认profiling是关闭的，可以通过set语句在Session级别开启profiling

set profiling=1 ; //开启profiling 开关；

打开后，执行一些CRUD操作，再show profiles 指令，可查看sql语句执行的耗时情况。

5、trace分析优化器执行计划

MySQL5.6提供了对SQL的跟踪trace, 通过trace文件能够进一步了解为什么优化器选择A计划, 而不是选择B计划。

打开trace ，设置格式为 JSON，并设置trace最大能够使用的内存大小，避免解析过程中因为默认内存过小而不能够完整展示。

SET optimizer_trace="enabled=on",end_markers_in_json=on;
set optimizer_trace_max_mem_size=1000000;

执行SQL语句：

...

最后，检查information_schema.optimizer_trace就可以知道MySQL是如何执行SQL的：

select * from information_schema.optimizer_trace\G;

6*、索引的使用

1、避免索引失效

全值匹配，对索引中所有列都指定具体值
最左前缀法则
范围查询右边的列，不能使用索引
不要在索引列上进行运算操作，索引将失效
字符串不加单引号，造成索引失效
尽量使用覆盖索引，避免select *

即只访问索引的查询（索引列完全包含查询列），如果查询列，超出索引列，也会降低性能

TIP : using index ：使用覆盖索引的时候就会出现 using where：在查找使用索引的情况下，需要回表去查询所需的数据 using index condition：查找使用了索引，但是需要回表查询数据 using index ; using where：查找使用了索引，但是需要的数据都在索引列中能找到，所以不需要回表查询数据
用or分割开的条件，如果or前的条件中的列有索引，而后面的列中没有索引，那么涉及的索引都不会被用到
以%开头的Like模糊查询，索引失效。如果仅仅是尾部模糊匹配，索引不会失效。如果是头部模糊匹配，索引失效。

解决方案：通过覆盖索引来解决

如果MySQL评估使用索引比全表更慢，则不使用索引
is NULL ， is NOT NULL 有时索引失效
in 走索引， not in 索引失效
单列索引和复合索引（*尽量使用复合索引，而少使用单列索引）

2、查看索引使用情况

show status like 'Handler_read%';
show global status like 'Handler_read%';

7*、SQL优化

1、大批量插入数据

当使用load 命令导入数据的时候，适当的设置可以提高导入的效率。

对于 InnoDB 类型的表，有以下几种方式可以提高导入的效率： 1）主键顺序插入因为InnoDB类型的表是按照主键的顺序保存的，所以将导入的数据按照主键的顺序排列，可以有效的提高导入数据的效率。如果InnoDB表没有主键，那么系统会自动默认创建一个内部列作为主键，所以如果可以给表创建一个主键，将可以利用这点，来提高导入数据的效率。

load data local infile '/root/sql.log' into table 'table_name' fields terminated by ',' lines terminated by '\n';

2）关闭唯一性校验在导入数据前执行 SET UNIQUE_CHECKS=0，关闭唯一性校验，在导入结束后执行SET UNIQUE_CHECKS=1，恢复唯一性校验，可以提高导入的效率。

set unique_checks=0;

...

set unique_checks=1;

3）手动提交事务如果应用使用自动提交的方式，建议在导入前执行 SET AUTOCOMMIT=0，关闭自动提交，导入结束后再执行 SET AUTOCOMMIT=1，打开自动提交，也可以提高导入的效率。

2、优化insert语句

如果需要同时对一张表插入很多行数据时，应该尽量使用多个值表的insert语句，这种方式将大大的缩减客户端与数据库之间的连接、关闭等消耗。使得效率比分开执行的单个insert语句快。
在事务中进行数据插入
数据有序插入

3、优化order by 语句

3.1 两种排序方式

1). 第一种是通过对返回数据进行排序，也就是通常说的 filesort 排序，所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。

2). 第二种通过有序索引顺序扫描直接返回有序数据，这种情况即为 using index，不需要额外排序，操作效率高。

了解了MySQL的排序方式，优化目标就清晰了：尽量减少额外的排序，通过索引直接返回有序数据。where 条件和Order by 使用相同的索引，并且Order By 的顺序和索引顺序相同，并且Order by 的字段都是升序，或者都是降序。否则肯定需要额外的操作，这样就会出现FileSort。

3.2 Filesort 的优化

通过创建合适的索引，能够减少 Filesort 的出现，但是在某些情况下，条件限制不能让Filesort消失，那就需要加快 Filesort的排序操作。对于Filesort ， MySQL 有两种排序算法： 1）两次扫描算法：MySQL4.1 之前，使用该方式排序。首先根据条件取出排序字段和行指针信息，然后在排序区sort buffer 中排序，如果sort buffer不够，则在临时表 temporary table 中存储排序结果。完成排序之后，再根据行指针回表读取记录，该操作可能会导致大量随机I/O操作。

2）一次扫描算法：一次性取出满足条件的所有字段，然后在排序区 sort buffer 中排序后直接输出结果集。排序时内存开销较大，但是排序效率比两次扫描算法要高。MySQL 通过比较系统变量 max_length_for_sort_data 的大小和Query语句取出的字段总大小，来判定是否那种排序算法，如果max_length_for_sort_data 更大，那么使用第二种优化之后的算法；否则使用第一种。可以适当提高 sort_buffer_size 和 max_length_for_sort_data 系统变量，来增大排序区的大小，提高排序的效率。

4、优化group by 语句

由于GROUP BY 实际上也同样会进行排序操作，而且与ORDER BY 相比，GROUP BY 主要只是多了排序之后的分组操作。当然，如果在分组的时候还使用了其他的一些聚合函数，那么还需要一些聚合函数的计算。所以，在 GROUP BY 的实现过程中，与 ORDER BY 一样也可以利用到索引。

如果查询包含 group by 但是用户想要避免排序结果的消耗，则可以执行order by null 禁止排序。如下：

explain select age,count(*) from emp group by 1 age order by null;

5、优化嵌套子查询

支持SQL的子查询。这个技术可以使用SELECT语句来创建一个单列的查询结果，然后把这个结果作为过滤条件用在另一个查询中。使用子查询可以一次性的完成很多逻辑上需要多个步骤才能完成的SQL操作，同时也可以避免事务或者表锁死，并且写起来也很容易。但是，有些情况下，子查询是可以被更高效的连接（JOIN）替代。连接(Join)查询之所以更有效率一些，是因为MySQL不需要在内存中创建临时表来完成这个逻辑上需要两个步骤的查询工作。

6、优化OR条件

对于包含OR的查询子句，如果要利用索引，则OR之间的每个条件列都必须用到索引，而且不能使用到复合索引；如果没有索引，则应该考虑增加索引。

我们来比较下重要指标，发现主要差别是 type 和 ref 这两项 type 显示的是访问类型，是较为重要的一个指标，结果值从好到坏依次是：

system > const > eq_ref > ref > fulltext > ref_or_null > index_merge >unique_subquery > index_subquery > range > index > ALL

UNION 语句的 type 值为 ref，OR 语句的 type 值为 range，可以看到这是一个很明显的差距 UNION 语句的 ref 值为 const，OR 语句的 type 值为 null，const 表示是常量值引用，非常快这两项的差距就说明了 UNION 要优于 OR 。

7、优化分页查询

优化思路一 在索引上完成排序分页操作，最后根据主键关联回原表查询所需要的其他列内容。

select * from tb1,(select id from tb1 order by id limit 2000000,10) a where t.id=a.id;

优化思路二 该方案适用于主键自增的表，可以把Limit 查询转换成某个位置的查询。

select * from table1 where id>1000000 limit 10;
#但是，主键id可能存在不是连续的情况，毕竟表总是会有删除操作

8、使用sql提示

SQL提示，是优化数据库的一个重要手段，简单来说，就是在SQL语句中加入一些人为的提示来达到优化操作的目的。

8.1 use index

在查询语句中表名的后面，添加 use index 来提供希望MySQL去参考的索引列表，就可以让MySQL不再考虑其他可用的索引。(只是给建议)

select * from table use index(another_index_name) where name='yuec'

8.2 ignore index

如果用户只是单纯的想让MySQL忽略一个或者多个索引，则可以使用 ignore index 作为 hint 。

select * from table ignore index(idx_name) where name = 'yuec';

8.3 force index

为强制MySQL使用一个特定的索引，可在查询中使用 force index 作为hint

select * from table force index(idx_name) where name = 'yuec';

微信关注我们

原文链接：https://my.oschina.net/yuec1998/blog/4732859

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

如何理解时间复杂度和空间复杂度

我们经常可以看到这样的描述：软件=数据结构+算法，可见算法基础对于一个程序员的重要性。算法中，有两个基本概念：时间复杂度和空间复杂度。时间复杂度：描述算法执行消耗的时间，时间越短，时间复杂度越低，算法越优秀；空间复杂度：描述算法执行所占用的内存空间，占用内存越少，空间复杂度越低，算法越优秀；因此，时间复杂度和空间复杂度是评价一个算法性能的主要指标。那么如何计算一个算法的时间复杂度和空间复杂度呢？简单理解，计算时间复杂度就是评估一个算法完成后执行了多少行代码，也就是算法所消耗的时间，但是该如何用数学的方式其表示出来呢？假设现在有个一个算法需要执行n次运算，我们用T(n)表示，n即表示算法的规模（比如n=10时，循环输出10次Hello World；n=100时，循环输出100次Hello World）。如果假设存在一个函数f(n)，表示随着n的变化，算法需要执行的次数，当T(n)=O(f(n))，那么O(f(n))即为算法的时间复杂度。比如，一个普通的循环： public int calc(int n) { int total = 0; for (int i = 0; i &...

2020-11-21

824

一、需求主要实现 nacos 作为配置中心的一些使用方法。二、实现功能 1、加载 product-provider-dev.yaml 配置文件 2、实现配置的自动刷新 3、实现加载多个配置文件 4、配置文件的优先级三、注意事项 1、和 nacos config 配置相关的代码都需要定义在 bootstrap.yml配置文件中 spring.application.name spring.profiles.active spring.cloud.nacos.config.xxx 2、测试的过程中，发现如果定时任务的类上增加类 @RefreshScope 注解，那么 nacos 中的配置属性动态修改后，这个定时任务会失效。(参考代码：com.huan.study.product.RefreshScopeScheduledTask) 3、如果在一个线程中，隔固定周期打印@Value注解中的值，在nacos修改值后，不会改变（参考代码 com.huan.study.product.PrintPropertiesTask#initPrint） 4、最好不要出现配置文件中存在优先级。四、功...

2020-11-22

770

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。