如何减少 Elasticsearch 集群中的分片数量-低调大师

如何减少 Elasticsearch 集群中的分片数量

2025-10-21 160

作者：来自 Elastic Alex Salgado

在本综合指南中了解Elasticsearch分片如何影响集群性能，包括如何获取分片数量、更改默认值以及在需要时减少分片数量。

Elasticsearch 新手？加入我们的 Elasticsearch 入门网络研讨会。您还可以开始免费的云试用或立即在您的机器上试用 Elastic。

Elasticsearch 减少分片数量 —— 说明与代码示例

当集群（cluster）中分片（shards）过多时，可以采取一些步骤来减少分片数量。本指南介绍了删除或关闭索引（indices）以及重新索引到更大索引的方法。下面我们将说明如何减少新建索引的分片数量、如何减少已存在索引的分片数量、如何减少主分片数量，以及如何减少基于时间的索引的分片数量。

如何减少新建索引的分片数量

在创建新索引时，应确保新建分片数量配置为尽可能小。

以常见的日志存储场景为例。自 Elasticsearch 7.0 起，默认每个索引有 1 个主分片，这已经是一个显著改进。然而，即使在这种更保守的配置下，你仍可以根据实际数据量进行优化。一个分片通常可以在保持良好性能的情况下容纳 10 到 50GB 的数据，因此如果你生成的数据量低于这个范围，可以保持默认的 1 个分片。对于更大的数据量，可以遵循每 10–30GB 一个分片的一般原则，并根据搜索与索引性能需求进行调整。

最简单的方式是创建一个索引模板并将其存储在集群状态中。以下请求将创建一个名为 “template_1” 的索引模板。它会应用到所有以 “log” 开头的新建索引名称上，并将每个索引的主分片数量设置为 1。

PUT _index_template/template_1
{
  "index_patterns": ["log*"],
  "template": {
    "settings": {
      "index.number_of_shards": 1,
      "index.number_of_replicas": 1  // Default is 1 if not specified
    }
  }
}

注意：如果你没有在模板中指定 number_of_replicas，Elasticsearch 将使用默认值——每个主分片 1 个副本。你可以根据容错和性能需求进行调整。

具体代码语法可能会因所使用的 Elasticsearch 版本而有所不同，请参考创建索引模板的文档。

如何减少现有索引的分片数量

减少副本分片数量

减少分片数量的一个简单方法是降低副本数量。更改副本数量可以通过单个请求动态完成，只需几秒钟。

通常建议每个索引有 1 个副本分片，即每个分片在另一个节点上保留一份副本（除非你有大量并行搜索请求）。副本用于故障切换保护和提升搜索性能。如果包含主分片的节点宕机，其中一个副本会被提升为主分片，确保数据在搜索和新索引操作中保持可用。副本还能提高集群的弹性，并更均匀地分配负载。

不过，副本策略取决于集群的瓶颈。如果集群因大量索引操作而过载，将副本数量减少为 0 可以快速缓解压力。反之，如果集群在搜索性能上有瓶颈且容量充足，增加副本反而能帮助分担搜索负载。需要注意的是，将副本数设为 0 会失去容错能力，不应长期保持这种设置。

记住，副本数量也可以在前面展示的索引模板中进行配置。

以下请求会将所有以 “log” 开头的索引的副本分片数量设置为 0：

PUT log*/_settings
{
  "index" : {
    "number_of_replicas" : 0
  }
}

减少主分片数量

每个索引的主分片数量无法动态更改 —— 它是不可变的。用于在多个分片之间分配新文档的路由算法依赖于主分片总数。因此，减少现有索引的主分片数量会稍微复杂一些。

基本上，你需要创建一个新索引并复制所有数据。可以使用两种API来实现：Shrink API和Reindex API。这两种 API 各有优缺点，适用性取决于你的配置和需求。Shrink API 速度更快，但只能用于只读索引（即不再更新或插入文档的索引）；Reindex API 则可用于活动索引。

使用 Shrink API 减少分片数量

你可以根据索引大小将分片过多的索引缩减为更少的分片数量 —— 请参考相关的大小调整文档以获取指导。可缩减到的分片数量有一定限制，请务必阅读文档以确认此选项是否适合你的情况。

请注意，缩减索引需要一定的维护时间。首先，索引的所有主分片必须分配到同一节点上。请确保该节点有足够的存储空间（如果没有，请考虑使用下文所示的 Reindex API）。然后，需要将索引标记为只读。

以下请求将把所有以 “log” 开头的索引设置为只读，并将所有分片移动到名为 “shrink_node_name” 的节点上。

警告：不要在正在写入的索引上运行此命令。将索引设置为只读会立即阻止所有写入操作，导致索引失败。此方法仅适用于不再接收新数据的索引。

PUT log*/_settings
{
  "settings": {
    "index.blocks.write": true,
    "index.routing.allocation.require._name": "shrink_node_name" 
  }
}

你需要使用下面的命令逐个缩减索引。分片分配会恢复为默认状态，索引也将重新变为可写。

POST log-1/_shrink/log-shrink-1
{
  "settings": {
    "index.routing.allocation.require._name": null,
    "index.blocks.write": null
  }
}

具体语法可能会因所使用的 Elasticsearch 版本而有所不同，请参考 Shrink index API 文档。

使用 Reindex API 减少分片数量

如果要缩减的索引仍在被写入，可以使用 Reindex API。

Reindex API 可用于将文档分批从一个索引复制到另一个索引。在这种情况下，所有需要在索引时执行的工作都必须重新执行。这使得使用 Reindex API 比直接复制整个分片更慢，但仍是相对较快的过程。

Reindex API 会创建源索引的一个时间点视图，并将其保存在临时搜索上下文中，然后从该上下文中复制所有文档。在重新索引过程中创建的文档不会被复制，因为它们不存在于该上下文中。

有两种方法可以进行操作。第一种方法只需要一次重新索引操作，第二种需要两次。以下是这两种方法的工作方式。

在第一种方法中，你需要在开始重新索引之前，先将所有索引写入流量重定向到新索引。步骤如下：

创建一个具有更少分片的新索引
创建一个同时搜索旧索引和新索引的别名
将所有写入流量重定向到新索引
启动从旧索引到新索引的重新索引过程
完成后，删除别名并删除旧索引

这种方法确保数据零丢失，同时避免了双写或多次重新索引的复杂性。

步骤 1：创建具有所需分片数量的目标索引：

PUT log-shrink-1
{
  "settings": {
    "index.number_of_shards": 1,
    "index.number_of_replicas": 1
  }
}

步骤 2：创建一个别名，使其可以同时搜索两个索引：

POST _aliases
{
  "actions": [
    {
      "add": {
        "index": "log-1",
        "alias": "logs-search"
      }
    },
    {
      "add": {
        "index": "log-shrink-1",
        "alias": "logs-search"
      }
    }
  ]
}

步骤 3： 将所有写入流量重定向到新索引

注意：在你的应用程序中，将目标索引从 "log-1" 改为 "log-shrink-1" 即可

步骤 4： 将所有文档从旧索引复制到新索引：

POST _reindex
{
  "source": {
    "index": "log-1"
  },
  "dest": {
    "index": "log-shrink-1",
    "op_type": "index"
  }
}

步骤 5： 重新索引完成后，删除别名并删除旧索引：

POST _aliases
{
  "actions": [
    {
      "remove": {
        "index": "log-1",
        "alias": "logs-search"
      }
    }
  ]
}
 
DELETE log-1

第二种方法略有不同，索引写入流量仅在第一次重新索引操作完成后才重定向到新索引，这需要运行第二次重新索引操作，将第一次重新索引期间在旧索引中写入的新文档复制过来。步骤如下：

创建一个具有更少分片的新索引（同上文步骤 1）
启动从旧索引到新索引的重新索引过程（同上文步骤 4）。记录开始此步骤的时间戳
完成后，将所有写入流量重定向到新索引（同上文步骤 3）
创建一个别名，使其可以同时搜索两个索引（同上文步骤 2）。注意，这允许在下一步重新索引期间，新索引到旧索引的文档仍可被搜索，但有些文档可能暂时在搜索结果中出现两次
运行第二次重新索引操作，将新索引的文档复制过来，使用下面的命令并使用步骤 2 中记录的时间戳：

POST _reindex
{
  "source": {
    "index": "log-1",
    "query": {
      "range": {
        "@timestamp": {
          "gte": "2025-01-28T10:00:00"
        }
      }
    }
  },
  "dest": {
    "index": "log-shrink-1",
    "op_type": "index"
  }
}

6. 当第二次重新索引操作完成后，你可以删除旧索引和别名（同上文步骤 5）。

为基于时间的索引减少分片数量

如果你使用基于时间的索引名称，例如每日日志索引，但数据量不足，减少分片的一个好方法是改用每周或每月的索引模式。

你也可以按月、季度或年份将旧的只读索引进行分组。最简单的方法是使用 Reindex API。

为多租户索引减少分片数量

当你有多租户场景，每个客户一个索引时，减少分片看起来会更困难。

在多租户情况下，你可能有一些大客户，每个索引有一个或多个分片，大小看起来合适。同时，也会有许多客户的索引较小。

如果在这种配置下仍需要为每个客户保留一个索引，可以使用 Filtered Aliases。

使用 Filtered Aliases 减少分片数量

Filtered Aliases 不像 “普通” 索引别名那样常见，但它允许你为一个索引创建多个视图。

你可以不为每个租户或客户创建一个索引，而是为所有较小的租户创建一个索引，这些租户小到不值得单独索引。然后添加一个关键字或数字字段来区分这些租户（如客户名称或客户 ID）。

创建索引后，只需在该索引上创建一个过滤别名，并将租户名称作为别名即可。

应用程序不会注意到后台使用了过滤别名，它们只需使用别名即可。但你可以在一个索引中存储许多不同租户，避免分片过多。

重要考虑事项：这种方法可能会受 “嘈杂邻居” 影响 —— 当不同租户共享同一分片时，更活跃的租户可能影响较安静租户的性能。监控租户的活动模式，并考虑将使用特性相似的租户分组。

前提是你为所有客户使用兼容的数据模型。

下面的请求展示了如何在索引上创建过滤别名：

POST _aliases
{
  "actions":[
    {
      "add":{
        "index":"small-customers",
        "alias":"customer-1",
        "filter":{
          "term":{
            "customer-id":"1"
          }
        }
      }
    }
  ]
}

在多租户环境中减少分片数量时，你可以为所有小型租户创建一个新索引，并使用 Reindex API 复制数据。如果需要添加新字段以区分租户，例如 "customer-id"，可以使用 ingest pipeline 添加新字段。

不想担心分片吗？不想担心分片吗？如果管理分片数量、容量和优化对你来说太复杂，可以考虑 Elasticsearch Serverless —— 我们的托管产品，你可以专注于业务逻辑，而我们处理所有基础设施复杂性，包括优化的分片管理和自动扩缩容。

微信关注我们

原文链接：https://my.oschina.net/u/3343882/blog/18696474

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Andrej Karpathy 评 DeepSeek-OCR 论文：图像输入可能成为大语言模型新方向

特斯拉前自动驾驶负责人、OpenAI联合创始人Andrej Karpathy近日在推特上评论了开源的DeepSeek-OCR论文，提出了一个颇具启发性的观点：相比传统文本输入，图像作为大语言模型（LLM）的输入形式可能更加高效。这一观点在AI研究社区引发了关于模型输入方式未来演进方向的讨论。 Karpathy认为，当前广泛使用的文本token输入方式可能既浪费又低效，未来研究或许应该转向图像输入。他从几个维度阐述了图像输入相比文本输入的潜在优势。首先是信息压缩率的提升。将文本渲染成图像后，可以用更少的视觉token传递更多信息。这是因为一个图像patch可以包含多个字符的信息，而在传统文本tokenization中，每个字符或子词都需要单独的token。在处理大规模上下文时，这种压缩可能显著提升模型效率，降低计算成本。其次是信息表达的丰富性。图像输入天然支持加粗、颜色、字体大小、布局等视觉元素，这些格式信息在传统纯文本输入中要么丢失，要么需要通过额外的标记语言（如Markdown）来表示，后者又会增加token消耗。直接使用图像可以让模型更自然地理解文档的视觉结构和强调重点。第三...

2025-10-21

193

核心能力 1. 全流程自动化打通 Jen/行云/京东云OSS/零售云OSS/NP/CDN/R2M/JimDB/科技容器/零售容器/域名解析/镜像适配/测试站发布等全链路实现资源免维护部署，提升部署效率 2. 高可用架构支持高并发访问，具备主备容灾机制系统稳定性与可维护性全面提升 3. 精细化部署策略新增前端灰度发布能力支持按业务需求灵活选择部署模式部署模式共享集群适用场景：B端类应用（P2或以下）、C端低流量页面（P2或以下）特点：无需单独申请容器资源主备兜底保障资源池化共享私有集群适用场景： C端高流量页面（P0/P1级）部门级需求（部门内部独立）特点：提供独享容器资源及主备容灾部门内资源共享二、技术设计-流量视角站在前端研发视角，您可以创建私有集群、共享集群应用。共享集权分为常规模式与open模式。open模式下，您不需要创建应用即可发布前端应用，open模式仅支持测试环境。详见图1所示图1 1. 常规流量前端研发创建应用的时候，选择是否开启cdn，可以分为开启cdn与未开启cdn两种方式。用户在浏览器打开url后，会根据研发的配...

2025-10-21

177

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。