什么是走索引？-低调大师

什么是走索引？

2022-06-15 537

索引是一种利用某种规则的数据结构与实际数据的关系加快数据查找的功能。我们的数据库中存储有大量的内容，而索引能够通过数据节点，根据特定的规则和算法快速查找到节点对应的实际文件的位置。简单来说索引就像书的目录，能够帮助我们准确定位到书籍具体的内容。

最近在学习索引的时候遇到了一个问题，下面我们通过重现的方式来看一下。

首先建立一个如下测试表：

CREATE TABLE `simple_table` (
  `id` int NOT NULL AUTO_INCREMENT,
  `c1` datetime DEFAULT NULL,
  `c2` datetime DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `c2__idx` (`c2`),
  KEY `fun_c1_idx` ((cast(`c1` as date)))
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

fun_c1_idx: 是mysql8开始支持的函数索引

然后往这个表里随机插入1000 条数据。

select * from simple_table where date(c2) = '2022-01-01';

可以看到上面的这条 SQL 语句不能走索引。因为索引树中存储的是列的实际值和主键值，所以对条件字段做函数操作是会让索引失效的。简单来说就是，如果拿 ‘2022-01-01’ 去匹配，将无法定位到索引树中的值。因此正确选择是放弃走索引，选择全表扫描。

我们再看下一条 SQL。

select id,c2 from simple_table where date(c2) = '2022-01-01';

与第一条不同，这条 SQL 只返回了部分列，而且这些列都在索引中了。然后我们用 explain 分析一下这条 SQL 的执行计划，判断它能否走索引：

上图可以明显看到 key 值为c2__idx，即走了索引。

这里就很奇怪，不是说对条件字段做函数操作是会让索引失效吗，为什么这里又走了索引？

这就是我当时在学习时遇到的问题，后来我发现是因为我没有搞清楚“走索引”的意思。大家都知道索引能加快查询，但是索引能加快查询的原因你知道么？答案是减少了查询的次数。

现在我们回到上面的 SQL，可以看到虽然key 值为c2__idx，但是 rows 值为 1000。也就是扫描了扫描全表，即 c2__idx的所有记录。但是由于c2__idx已经包含了所有需要查询的列，优化器才选择了走这个索引。

最后再来思考一个问题，使用了索引是否一定快？这个问题我们通过一个具体例子看一下：

select * from simple_table;
select * from simple_table where id > 0;

不需要 explain 分析直接肉眼观察就能看到第一条 SQL 没有走索引，第二条 SQL 使用了主键索引。可以看到没有使用索引的速度快一些，这是因为虽然使用了索引，但是还是从主键索引的最左边的叶节点开始向右扫描整个索引树，进行了全表扫描，这让索引失去了意义。

总结一下：查询是否使用索引，只是表示一个 SQL 语句的执行过程；而是否为慢查询，是由它执行的时间决定的，也就是说是否使用了索引和是否是慢查询两者之间没有必然的联系。我们在使用索引时，不应只关注是否起作用，而应该关心索引是否减少了查询扫描的数据行数，扫描行数减少效率才会得到提升。对于一个大表，不止要创建索引，还要考虑索引过滤性，过滤性好，执行速度才会快。

传统企业数字化转型，到底难在哪里？

数字化浪潮轰轰烈烈，被卷入其中的不只是 IT 技术行业，各行各业都裹挟其中。 2022年的政府工作报告提出，要促进数字经济发展，加强数字中国建设整体布局，建设数字信息基础设施，推进5G规模化应用，促进产业数字化转型，发展智慧城市、数字乡村。然而，这并不是政策第一次强调“数字经济”。事实上，从2017年的“促进数字经济加快成长”开始，这已经是“数字经济”第五次被写入政府工作报告了。相应地，数字化转型浪潮也在各行各业中兴起，热度一时无两。近年来，O2O、大数据等概念先后涌现，也出现了一批新型的数字化科技企业，这给传统企业带来了无形的压力。固守一隅，很难不被时代淘汰；而激进闯入，又难以保证不落入“起了个大早，赶了个晚集”的尴尬境地。传统企业不像互联网企业，不仅无法在开发技术团队上投入很大比例的资源，而且还要求强业务导向、为业务赋能。与此同时，传统企业在数字化转型中，又总会遇见这样那样的问题，这就呼吁更新的解决办法和更好用的工具出现。 01 “数字化”实现不易，传统企业面临“内外部困境” 什么是“数字化”？有了解过的人都知道，“数字化”绝不是将流程、表单、数据等搬到电脑上这么简单。目前...

2022-06-14

485

原文链接：实时开发平台建设实践，深入释放实时数据价值视频回顾：点击这里课件获取：点击这里一、实时数仓建设背景随着整体行业的数字化转型不断深入以及技术能力的不断提高，传统的 T+1 式（隔日）的离线大数据模式越来越无法满足新兴业务的发展需求，开展实时化的大数据业务，是企业深入挖掘数据价值的一条必经之路。面对数字化转型下的数据快速产生、“小步快跑”的精细化运营及实时化和自动化的决策需求，如何提高实时数据处理能力将成为企业提升竞争力的一大因素。而企业在建设实时数据应用时，又往往面临诸多困难：实时开发技术门槛高，学习难度大，开发过程依赖各种引擎，链路复杂开发数据效率低，代码调试复杂建设成本、使用成本高数据建模及开发规范不统一，问题难监控，管理困难为了解决这些问题，我们在实时建设过程中需要确定建设方式和建设目标，帮助企业更好的实现实时数仓建设。二、实时数仓建设方法论如何帮助企业建设实时数仓，我们主要从以下四个步骤入手： 1、明确需求企业进行实时数仓建设的第一步是明确需求，需求需要业务需求和技术需求想结合。 1）业务需求方面：详细梳理各类实时计算应用场景详细梳理每个...

2022-06-15

626

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。