ParadeDB —— 基于 Postgres 的 ElasticSearch 替代方案
ParadeDB 是基于 Postgres 构建的开源 ElasticSearch 替代方案。开发团队正在构建 ElasticSearch 产品套件的功能,首先是搜索。 ParadeDB 提供所有 Postgres 数据库中最全面的 Postgres 原生搜索功能。 全文搜索。使用可配置的分词器、17 种语言的词干以及基于 SQL 的可扩展查询语言按关键字或短语进行搜索。 相似性搜索。使用预安装的 pgvector 扩展和工作流程按语义进行搜索,逐步保持向量同步。 混合搜索。通过混合搜索提供更高精确度和召回率的结果,该搜索结合了全文搜索和相似性搜索的优势。 BM25 Scoring。全文搜索结果按 BM25 排序,BM25 是 ElasticSearch 使用的基于术语的排名算法。 分面搜索。通过分面搜索存储和收集搜索结果的统计指标。 分布式搜索。ParadeDB 自动对索引进行分片,使开发人员的搜索速度比单节点 Postgres 快数百倍。 ParadeDB 的搜索引擎基于 Tantivy 开发,Tantivy 是 Apache Lucene 的基于 Rust 的实现。

