ParadeDB —— 基于 Postgres 的 ElasticSearch 替代方案
ParadeDB 是基于 Postgres 构建的开源 ElasticSearch 替代方案。开发团队正在构建 ElasticSearch 产品套件的功能,首先是搜索。
ParadeDB 提供所有 Postgres 数据库中最全面的 Postgres 原生搜索功能。
- 全文搜索。使用可配置的分词器、17 种语言的词干以及基于 SQL 的可扩展查询语言按关键字或短语进行搜索。
- 相似性搜索。使用预安装的 pgvector 扩展和工作流程按语义进行搜索,逐步保持向量同步。
- 混合搜索。通过混合搜索提供更高精确度和召回率的结果,该搜索结合了全文搜索和相似性搜索的优势。
- BM25 Scoring。全文搜索结果按 BM25 排序,BM25 是 ElasticSearch 使用的基于术语的排名算法。
- 分面搜索。通过分面搜索存储和收集搜索结果的统计指标。
- 分布式搜索。ParadeDB 自动对索引进行分片,使开发人员的搜索速度比单节点 Postgres 快数百倍。
ParadeDB 的搜索引擎基于 Tantivy 开发,Tantivy 是 Apache Lucene 的基于 Rust 的实现。