千万级索引的聚合性能优化-低调大师

千万级索引的聚合性能优化

2021-12-30 766 89

当搜索引擎 ElasticSearch 面对千万级索引量的去重统计时，该如何实现快速的响应。本文将结合我们的亲身经历，为读者朋友呈现生产环境中遇到这类问题时的解决思路。

1. 背景

在数周前的某一天，交易团队的同学发现运行在某云上面的订单索引存在严重的增量同步延迟问题，且已经对业务造成了影响。所以将该索引的流量切换到自研搜索平台中，虽说自研搜索不存在增量延迟情况，但却发现查询的 RT 竟高达十几秒，依旧无法解决业务面临的困境。

当时获知该情况时还是比较错愕的，接口 RT 的增长通常是个渐进式的过程，既然存在性能问题应该在早期就有所表现，不至于突然暴涨至十几秒。进一步了解情况后，得知一年前由于当时的自研搜索平台基建不够成熟，该索引的查询流量便一直由三方云服务承接。过去这么长时间，自研搜索平台仅保留着该索引的增量功能，但从未对外提供检索服务。而如今突然将查询流量导入自研平台，不曾预料到会存在如此严重的查询性能问题。

ElasticSearch 作为一款能够轻松应对上亿规模检索的分布式搜索引擎，却发生如此“反常”的表现，下意识就觉得症结应该出在我们的使用方式上。在抓取了相关的 DSL 语句后很快便定位到了问题根源，主要由于业务场景中会对某个查询字段作去重后的计数统计，用到了 ES 中 cardinality 这一项聚合功能。这原本是个非常普通的操作，然而由于匹配到的订单索引数高达千万级，此时的聚合操作需要消耗大量的计算资源，以致RT暴涨。

2. 原因

为了证实慢查是因聚合所致，我们先后做了两次对比实验。

第一次包含去重查询，涉及数据量1450W，用时超 7 秒。

（为什么没有上文提到的超10秒？这是因为期间我们做过一次ES集群扩容，增加节点和分片数后执行效率有所提升）

第二次移除聚合语句，此时的查询耗时仅 184 毫秒。

要了解背后的差异，我们需要先对cardinality建立认知。它是基于 HyperLogLog++ （HLL）算法实现的一种近似度量算法。这涉及到对输入条件作 hash 运算，然后根据哈希运算的结果中的 bits 做概率估算从而得到基数。

HLL 本身便是一种非常高效的算法，可毕竟还是需要对全量的数据集合都做一遍 hash 运算。如果是几万、几十万的统计量，用户对于由此产生额外的几十毫秒，甚至上百毫秒性能开销是不太敏感的。可倘若统计量达到百万级，乃至千万级，计算时长增加了几十倍，上百倍，慢查的体感则非常明显。

至此，我们可以得出一个结论：引发慢查的直接原因是由于需要参与 hash 运算的数据集合过于庞大。

3. 步入误区

找到原因后，便可以对症下药。不过很遗憾，当时我们采取的第一个解决方案不仅没有获得预期的效果，反而引发了其他问题。

起初我们认为，既然导致慢查的直接原因是参与 hash 运算的数据量太多了，那我们是否可以在保证不改变召回结果的前提下，通过减少参与聚合统计的数据量来改善性能。

虽然这种聚合方式会导致统计结果失真，但由于系统本就要求召回结果限制在1万以内（ 比如匹配查询条件的索引数有2万条，但系统提供的分页能力最多查询前1万条索引），这意味着只需针对排序的前1万条记录作聚合也是可被接受的。

顺着这个思路，我从 ES 文档中找到了 terminate_after。该属性会限制查询请求在每个索引分片中召回的记录数，缓解了因匹配索引数过多而引发的资源开销。

乍一看这确实是我们需要的解决方案，可是上线后才发现使用 terminate_after之后召回的结果不是“最佳”匹配，仅仅是符合过滤条件而已，最直观的表现便是排序效果失效，因此不得已只能弃用该方案。

4. 寻找正解

既然无法减少聚合数据集，我们便只能从节省 hash 运算开销这个方向入手。幸运的是， ElasticSearch 已经为此提供了很好的解决方案，即：hash预运算。

这是一种将 Hash 运算的过程从查询阶段的实时计算，前置到索引创建阶段的策略。在创建索引的同时，计算出待聚合字段的 hash 值并写入索引文件，查询环节便可直接对 hash 进行统计。该策略尤为适用读多写少，且聚合基数庞大的场景。

而要启用该策略，我们还需要对ES集群和搜索工程做一些调整。具体如下：

在ES集群中安装mapper-murmur3插件并重启服务。
```
sudo bin/elasticsearch-plugin install mapper-murmur3
```

修改索引模板，为聚合字段设置 hash field。

{
	"mappings": {
        "trade_id": {
    	    "type" : "keyword",
            "fields" : {
                "hash" : {
                    "type" : "murmur3"
                }
            }
        }
    }
}

改写查询时的DSL语句，采用<聚合字段>.hash的形式查询。

通过 hash 预运算的方式，我们可以看到查询性能由原先的 7 秒多骤降至不到500ms，几乎可以算是完美解决了聚合的性能问题。

5. 思考

虽说本次遇到的问题算是得到了圆满的解决，但是在我看来 hash 预运算也只能作为阶段性方案。假设我们需要统计的数据集合高达数亿、数十亿、百亿，届时我们依旧陷入了因量变而导致质变的局面。

所以，我认为最终的解决方案还是需要在数据的统计量上作出妥协，回归到一开始误入的那条“歧途“。只不过目前还未找到一种即保留排序效果，又能限制聚合索引数量的最优解。如对此有研究的朋友，欢迎留言交流。

微信关注我们

原文链接：https://my.oschina.net/u/2385344/blog/5385502

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2021-12-30 03:39:00

运维的线上系统故障总结

线上故障是一件让人很“紧张”的事情，之所以用紧张这个词，是因为暂时找不到更好的词汇描述遇到时的心态。对于运维人员来说，出现故障，可能意味着: 失职、麻烦、质疑、加班、绩效、无尽的报告等负面词汇，但也意味着: 机会与挑战。前者大家都好理解，后者也是很重要的，为什么呢？故障的机会与挑战一、有一部分故障是大家都没有预料到的。个人对故障的发生是不用担责的，只需要善后就可以这种。比如机房突然断电了这种大故障，来电后各种毛病就出现了，开不了机、服务启不起来、启动顺序又不对、配置丢了、网络不通、数据异常等等。这种情况就非常锻炼人啦，只要出现过一次，一般你之后就会对此项目的全局掌握比较清晰了，并且一般遇到这种大场面，也正是展示你台下十年功露脸的最好时机，但可遇不可求。小故障当然也有学习的价值，遇到得越多，对经验的提升和以后对问题的全面分析能力都有帮助。二、有一部分故障是个人操作失误导致的。我们经常说，人总是会犯错的嘛，但这样自言自语说多了后就会让人产生懈怠、疏忽，经历或个人导致故障后，成长更快。说一个小故事，我在之前一个项目组时，几乎每个人都有造成过线上故障，于是一旦新人来后，我都...

574

2021-12-30 10:44:00

实践解析可视化开发平台FlinkSever优势

摘要：华为Flink可视化开发平台FlinkServer作为自研服务，能够提供比原生flinksql接口更强的企业级特性，比如任务的集中管理，可视化开发，多数据源配置等。本文分享自华为云社区《华为FusionInsight MRS实战 - Flink增强特性之可视化开发平台FlinkSever开发学习》，作者：晋红轻。背景说明随着流计算的发展，挑战不再仅限于数据量和计算量，业务变得越来越复杂。如何提高开发者的效率，降低流计算的门槛，对推广实时计算非常重要。 SQL 是数据处理中使用最广泛的语言，它允许用户简明扼要地展示其业务逻辑。Flink 作为流批一体的计算引擎自1.7.2版本开始引入Flink SQL的特性，并不断发展。之前，用户可能需要编写上百行业务代码，使用 SQL 后，可能只需要几行 SQL 就可以轻松搞定。但是真正的要将Flink SQL开发工作投入到实际的生产场景中，如果使用原生的API接口进行作业的开发还是存在门槛较高，易用性低，SQL代码可维护性差的问题。新需求由业务人员提交给IT人员，IT人员排期开发。从需求到上线，周期长，导致错失新业务最佳市场时间窗口。同...

501

资源下载

更多资源

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9（Java Web服务器）

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。