ParadeDB —— 基于 Postgres 的 ElasticSearch 替代方案
ParadeDB 是基于 Postgres 构建的开源 ElasticSearch 替代方案。开发团队正在构建 ElasticSearch 产品套件的功能,首先是搜索。
ParadeDB 提供所有 Postgres 数据库中最全面的 Postgres 原生搜索功能。
- 全文搜索。使用可配置的分词器、17 种语言的词干以及基于 SQL 的可扩展查询语言按关键字或短语进行搜索。
- 相似性搜索。使用预安装的 pgvector 扩展和工作流程按语义进行搜索,逐步保持向量同步。
- 混合搜索。通过混合搜索提供更高精确度和召回率的结果,该搜索结合了全文搜索和相似性搜索的优势。
- BM25 Scoring。全文搜索结果按 BM25 排序,BM25 是 ElasticSearch 使用的基于术语的排名算法。
- 分面搜索。通过分面搜索存储和收集搜索结果的统计指标。
- 分布式搜索。ParadeDB 自动对索引进行分片,使开发人员的搜索速度比单节点 Postgres 快数百倍。
ParadeDB 的搜索引擎基于 Tantivy 开发,Tantivy 是 Apache Lucene 的基于 Rust 的实现。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
每日一博 | 米哈游大数据云原生实践
作者:米哈游大数据开发 近年来,容器、微服务、Kubernetes 等各项云原生技术的日渐成熟,越来越多的公司开始选择拥抱云原生,并开始将 AI、大数据等类型的企业应用部署运行在云原生之上。以 Spark 为例,在云上运行 Spark 可以充分享有公共云的弹性资源、运维管控和存储服务等,并且业界也涌现了不少 Spark on Kubernetes 的优秀实践。 在刚刚结束的 2023 云栖大会上,米哈游数据平台组大数据技术专家杜安明分享了米哈游大数据架构向云原生化升级过程中的目标、探索和实践,以及如何通过以阿里云容器服务 ACK 为底座的 Spark on K8s 架构,获得在弹性计算、成本节约以及存算分离方面的价值。 背景简介 随着米哈游业务的高速发展,大数据离线数据存储量和计算任务量增长迅速,早期的大数据离线架构已不再满足新场景和需求。 为了解决原有架构缺乏弹性、运维复杂、资源利用率低等问题,2022 年下半年,我们着手调研将大数据基础架构云原生化,并最终在阿里云上落地了Spark on K8s + OSS-HDFS 方案,目前在生产环境上已稳定运行了一年左右的时间,并获得了弹性计...
-
下一篇
马化腾回应早期微信“偷窥”用户相册:图片缓存加速造成的误会
据 CSDN 报道,针对早前有软件工程师爆料称包括微信等在内的多款国民级 App 在后台反复读取用户相册一事,1月5日,马化腾独家回应:“应该是21年10月的事了,图片缓存加速造成的误会,后面应该用 iOS 新的解决卡顿的 API 解决了”。并特别表示,“可以帮忙辟谣”。 事情的前因还要追溯到 2021 年 10 月 8 日,当时苹果 iOS 15 刚刚推出隐私新特性 「记录 App 活动」,对所有 App 的隐私读取行为进行了 7 天的监控,并使用 App Privacy Insights 对记录进行读取。 数码博主、软件开发工程师 @Hackl0us 发现微信在用户未主动激活 App 的情况下,在后台数次读取用户相册,每次读取时间长达 40 秒 至 1 分钟不等。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Docker容器配置,解决镜像无法拉取问题
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8编译安装MySQL8.0.19
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Hadoop3单机部署,实现最简伪集群
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- MySQL8.0.19开启GTID主从同步CentOS8
- Red5直播服务器,属于Java语言的直播服务器