介绍一种新的向量存储格式：DiskBBQ-低调大师

介绍一种新的向量存储格式：DiskBBQ

2025-10-13 146

作者：来自 Elastic Benjamin Trent, John Wagster 及 Ignacio Vera Sequeiros

介绍 DiskBBQ，一种 HNSW 的替代方案，并探讨何时以及为何使用它。

测试 Elastic 的领先、开箱即用的功能。深入了解我们的示例笔记本，开始免费云试用，或立即在本地计算机上试用 Elastic。

DiskBBQ 是 Inverted Vector File (IVF) 索引的进化版。它是 Hierarchical Navigable Small Worlds (HNSW) 的替代方案，通过将向量划分为更小的簇，在低内存场景下能更高效地处理，同时提供良好的查询性能。

HNSW 有什么问题？

我们非常喜欢 HNSW。它是一种快速且计算高效的算法，能以对数级扩展到你的向量数据。然而，这种速度是有代价的。为了让 HNSW 良好运作，所有向量都需要驻留在 RAM 中。虽然我们通过引入越来越好的量化方法降低了成本，但仍然存在向量溢出内存导致性能骤降的问题。

此外，在建立索引时，你必须搜索现有的 HNSW 图。因此，RAM 的所有内存成本在索引期间同样存在。这会显著拖慢那些无法完全将向量存放在 RAM 中的硬件。

DiskBBQ 有什么不同？

DiskBBQ 使用 Hierarchical K-means 将向量划分为小簇。然后在查询单个向量之前，先选择代表性的质心进行查询。它利用这种层级的多层特性，在查询时最多只查询 2 层质心，从而限制总的搜索空间。最后，它通过批量计算簇内向量与查询向量之间的距离，来探索每个簇中包含的向量。

图 0. Hierarchical KMeans 算法流程示例。将向量分段，对每一段进行聚类，并递归拆分直到达到所需的分区大小。

正如名字所暗示的，DiskBBQ 还使用我们的 BBQ (Better Binary Quantization) 来减小向量和质心的大小。这使得可以一次将许多向量块加载到内存中进行快速评分，同时需要极低的内存和磁盘开销。

DiskBBQ 的另一个有趣之处在于它允许向量被分配到多个质心。它使用了 Google 的Spilling with Orthogonality-Amplified Residuals (SOAR)的一个版本，将向量分配到多个簇中，这在向量位于两个簇边界附近时特别有益。由于向量被大量量化，这只会增加极少的磁盘开销，并且在搜索过程中需要探索的质心更少。

空谈无益，让我们看看一些数据。

HNSW 是按对数级扩展的。所以它一定比那种必须先搜索质心再对每个质心中的所有向量进行评分的方法快许多个数量级，对吧？

我们一直在努力让 DiskBBQ 完全具备与 HNSW 竞争的能力。虽然在所有情况下我们还没做到 100%，但对结果我们很满意。

DiskBBQ 利用了批量评分向量的优势，并尽可能多地在堆外执行操作。这意味着我们可以直接从文件中读取向量到内存中进行优化的向量运算，从而带来相当不错的性能。

DiskBBQ 有两个特别有趣的主要场景。第一个是整个索引都能放入 RAM 的情况。由于这是 HNSW 性能的关键，因此看看 DiskBBQ 在这种情况下的表现才公平。

表 0. DiskBBQ 在超过 100 万向量下的对比。所有数据都能舒适地放入内存。DiskBBQ 在索引速度上能快上惊人的 10 倍，同时在 BBQ 量化向量上的查询速度几乎与 HNSW 一样快。

当内存逐渐减少到整个索引不再能完全放入内存时，情况会变得更有趣。我们将会单独写一篇博客来深入探讨为什么 DiskBBQ 在低内存环境下更好，以及我们的测试方法。然而，这里先给出一些高层级的数据：

图 1：显示索引时间（毫秒）与 RAM / JVM Heap 的关系

随着总体内存减少，DiskBBQ 的索引性能会平稳下降。然而，HNSW 一旦内存非常受限，就会彻底崩溃。

图 2：显示搜索延迟（毫秒）与 RAM / JVM Heap 的关系

同样，我们看到 DiskBBQ 在搜索延迟上平稳下降。确实，它开始变慢，但随着内存越来越受限，HNSW 的延迟会呈指数增长。

什么时候应该使用 DiskBBQ？

DiskBBQ 和 HNSW 都将在 Elasticsearch 中持续改进。目前，DiskBBQ 在非常高召回率（99% 以上）和非常低延迟的性能上，还不如 HNSW。我们希望在继续投入 HNSW 的同时提升 DiskBBQ 的性能。

如果你需要非常非常高的召回率，有大量堆外内存（或者愿意为此付费），且索引更新较少（因此索引成本低），使用带有某种量化的 HNSW 仍可能是最佳选择。

然而，如果你能接受 95% 或更低的召回率，对成本敏感，但仍希望快速搜索，DiskBBQ 可能是你的解决方案。

我该如何使用 DiskBBQ？

以下是启用 DiskBBQ 并开始查询的方法：

设置一个类似这样的 mapping：

{
  "mappings": {
    "properties": {
       "image-vector": {
        "type": "dense_vector",
        "dims": 3,
        "similarity": "l2_norm",
        "index_options": {
          "type": "bbq_disk"
        }
      }
    }
  }
}

插入一个向量：

{ "image-vector": [0.0127, 0.1230, 0.3929] }

这是一个查询该向量的示例：

{
  "query" : {
    "knn": {
      "field": "image-vector",
      "query_vector": [0.0127, 0.1230, 0.3929]
    }
  }
}

你仍然可以使用 num_candidates 来控制近似。

这是一个查询该向量的示例：

{
  "query" : {
    "knn": {
      "field": "image-vector",
      "query_vector": [0.0127, 0.1230, 0.3929],
      "k": 10,
      "num_candidates": 50
    }
  }
}

DiskBBQ 很快将在 Elasticsearch Serverless 中可用。

原文：https://www.elastic.co/search-labs/blog/diskbbq-elasticsearch-introduction

微信关注我们

原文链接：https://my.oschina.net/u/3343882/blog/18695315

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

PostgreSQL 18 异步 I/O（AIO）调优指南

导语：PostgreSQL 18 中最大的变化是引入了异步 I/O (AIO) 子系统，这引出了一个问题：如何根据工作负载调整它？Tomas Vondra 这篇博客提供了如何设置 AIO 配置，并根据你的工作负载进行测试的实用指南。 PostgreSQL 18 已正式发布，该版本包含大量改进。其中一项重大架构变更是异步 I/O（Asynchronous I/O，简称 AIO） ——它支持对 I/O 操作进行异步调度，使数据库能更好地控制存储资源，同时提升存储利用率。本文不会详细解释 AIO 的工作原理，也不会展示详尽的基准测试结果。本文的核心目标是分享 PostgreSQL 18 中 AIO 的调优建议，并解释其中一些固有的但却不显而易见的权衡关系与限制。理想情况下，这些调优建议应被纳入官方文档，但这需要基于实践经验形成明确共识——而 AIO 作为全新特性，目前尚缺乏足够的生产环境验证数据。尽管在开发阶段我们已开展了大量基准测试，并据此设定了默认参数，但这无法替代实际生产系统的运行经验。因此，本文将基于个人经验，探讨如何（可能）调整默认参数，以及在此过程中需权衡的因素。 io_me...

2025-10-09

179

先看几个令人心动又让钱包一紧的 GPU 型号：NVIDIA A100 80GB、H800 80GB、RTX 4090 24GB... 这些 AI 时代的“超级马力”，无论我们是砸钱买断，还是花高价租用，都只能整块拿下。可除了模型训练，更多时候只是用来跑推理、开发/测试环境，几十上百 GB 的显存真的全能派上用场吗？多数情况下，你的 GPU 算力其实都在“摸鱼”，利用率可能连 20% 都不到。在算力就是钞票的 AI 时代，GPU 闲置哪是“摸鱼”，这分明是“撒币”行为。如果你是 AI 团队的 Leader，一边要交代高昂算力开销，一边还要安抚抱怨“GPU 不够、流程太慢”的团队成员，是不是早已身心俱疲？如果你是 MLOps 或平台工程师，每天盯着 GPU 集群利用率长期低于 20%，还得处理各种“抢资源”工单，是不是觉得自己的技术没用在刀刃上？如果你是 AI 算法工程师，只是想跑个预处理、验证模型、调试代码，却要为一张被“霸占”却没被用满的 A100/H800 排队数小时，灵感都快被磨光了吧？别急，今天的主角——HAMi，就是你的“开源解药”！ GitHub 地址：github...

2025-10-14

164

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。