干货 | Elasticsearch通用优化建议
干货 | Elasticsearch通用优化建议 1、题记 Elasticsearch开发实战的后期会遇到性能问题,包括:创建索引性能、写入数据性能、检索性能等。网上有很多结合自己实际应用场景的相关优化建议,但“对症下药”才是关键。 实际,官网已经有非常明确的相关优化建议。如果没有实战场景,一些特性的理解可能不到位。为此,我特定将官网建议做了翻译,并加了结合实战开发的通俗理解注释。 此为第一篇:通用优化一般建议。 后续会跟进索引优化、写入优化、检索优化、性能优化篇。 2、认知前提 为更好的理解优化建议,特将文中多次提及的核心概念做了提炼: 2.1 doc values 相比于倒排索引(通过关键词查找文档),doc values可以直接理解为“正排索引”(通过文档,查找关键词)。 doc values应用场景: 1)针对某field的排序(sort); 2)针对某field的聚合(aggregation); 3)特定的过滤(举例:geo 过滤) 4)针对特定字段的script操作。 2.2 norms norm是索引的评分因子。 如果您不关心评分,例如,如果您从未按分数对文档进行排序,则...
