国内首家!阿里云 Elasticsearch 8.9 版本释放 AI 搜索新动能
简介: 阿里云作为国内首家上线 Elasticsearch 8.9版本的厂商,在提供 Elasticsearch Relevance Engine™ (ESRE™) 引擎的基础上,提供增强 AI 的最佳实践与 ES 本身的混合搜索能力,为用户带来了更多创新和探索的可能性。
近年来,人工智能的快速发展和广泛应用在各个行业中都取得了显著的成果。在搜索领域,阿里云Elasticsearch作为一款功能强大的搜索引擎,一直以来都在为企业提供高效、准确的搜索服务。现在,阿里云作为国内首家上线 Elasticsearch 8.9版本的厂商,在提供 Elasticsearch Relevance Engine™ (ESRE™) 引擎的基础上,提供增强 AI 的最佳实践与 ES 本身的混合搜索能力,为用户带来了更多创新和探索的可能性。
此次从8.5版本到8.9版本的全新升级,新增了以下重点功能,使得阿里云 Elasticsearch 在向量检索和混合搜索能力都具有显著改善,大大提升了搜索结果的准确性和相关性。
- 支持文本和向量召回结果混排(RRF)。
- 向量最大维度提升到2048。
- 暴力检索性能提升。
- KNN 查询支持多个字段同时查询。
- 内置 ELSER模型。
- 稳定支持 NLP 分布式模型调度管理。
- ……
向量检索---为搜索插上飞跃的翅膀
向量检索作为8.x版本的重要新增能力,突破了传统的基于关键词的搜索,利用机器学习和人工智能的力量,将文本内容转换为向量表示,即将文本数据中的每个单词表示为一个向量,并通过计算向量之间的距离来判断文本之间的相似度来实现检索,从而实现文本的高效检索和处理。相较于传统文本检索,通过增加了单词和文档之间的语义关系,使得搜索的相关性显著提升;同时处理对象从文本到图像、语音等类型的扩展,应用场景的层面也得到了相应的增加;当然向量检索更能够根据用户偏好定制化搜索结果,为用户提供了个性化的搜索体验。
向量检索技术的应用场景非常广泛,包括搜索引擎优化、图像搜索、自然语言处理、推荐系统、情感分析等领域。现阿里云 Elasticsearch 产品已经提供向量检索基础能力,可根据基于 Elasticsearch 向量检索的以文搜图进行体验。
混合搜索 RRF---搜索结果和性能的双重助力
混合搜索 RRF(Reciprocal rank fusion)支持对多种不同方式召回的多个结果集进行综合再排序,返回最终的排序结果。之前 Elasticsearch 已经分别支持基于 BM25 的相关性排序和向量相似度的召回排序,通过 RRF 可以对这两者的结果进行综合排序,使得排序的准确性显著提升。相对于单一搜索搜索技术,混合搜索 RRF 的优势十分明显,可任意组合多个搜索技术并获得综合性搜索结果,使得搜索的准确性和相关性大幅提升,从场景的适应性来看,企业可根据自身业务设计专属搜索方案,自由度也明显提高。关于混合搜索 RRF 在搜索结果准确性和相关性提升的实验验证,可根据 阿里云 Elasticsearch 使用 RRF 混排优化语义查询结果对比 进行测试查看,并获得如下结果。
随着新版本的上线,阿里云 Elasticsearch 再次展现了其在搜索领域的不断前进。为用户带来了更加智能化和深层次的搜索体验。未来,阿里云 Elasticsearch 将继续努力创新,为用户带来更多搜索技术的突破和可能性。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
聊聊wireshark的进阶使用功能 | 京东云技术团队
1. 前言 emmm,说起网络知识学习肯定离不来wireshark工具,这个工具能够帮助我们快速地定位网络问题以及帮助正在学习网络协议这块的知识的同学验证理论与实际的一大利器,平时更多的只是停留在初步的使用阶段。也是利用部门内部的网络兴趣小组的讨论机会,私下对wireshark的一些进阶功能,比如专家模式、图表等功能进行调研,并结合实际场景抓包分析对功能进行对照说明。 2. wireshark中的分析菜单——专家模式 2.1什么是专家模式? Wireshark的专家信息是非常强大的一个分析模块,分别对错误、警告、注意、对话等数据信息做出分类和注释,对网络故障分析提供了强有力的信息依据,让你准确快速地判断出故障点,并进行下一步处理。 2.2 严重性级别的每种分类分别代表什么含义? ◦对话(Chat):关于正常通信的基本信息; ◦注意(Note):正常通信时的异常数据包; ◦警告(Warn):不是正常通信中的异常数据包(个人理解为:非正常的通信产生的数据包); ◦错误(Error):数据包中的错误,或者解析器解析时的错误; 2.3 除了严重性级别之外,专家信息项还按组进行了分类: ...
- 下一篇
网易国产开源分布式存储系统——Curve
导读:Curve 是一款高性能、易运维、云原生的开源分布式存储系统(CNCF Sandbox)。可应用于主流的云原生基础设施平台:对接 OpenStack 平台为云主机提供高性能块存储服务;对接 Kubernetes 为其提供 RWO、RWX 等类型的持久化存储卷;对接 PolarFS 作为云原生数据库的高性能存储底座,完美支持云原生数据库的存算分离架构。 Curve 亦可作为云存储中间件使用 S3 兼容的对象存储作为数据存储引擎,为公有云用户提供高性价比的共享文件存储。本文将介绍Curve块存储相关的部分,并分享Curve在一些场景的应用。 全文目录: 1.分布式存储介绍 2.Curve架构及介绍 3.Curve主要亮点 4.Curve RoadMap 5. 问答环节 01分布式存储介绍 1.分布式存储的分类 首先简单介绍一下分布式存储的分类。分布式存储可以分为三类:对象存储、文件存储和块存储。对象存储在互联网中应用的比较多,比如一个对象、一个图片、一个音频,这种可以通过PUT GET接口来进行存储。文件存储与传统意义的文件系统的区别是,它是分布式的,传统的项目对应的是Ext4...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Windows10,CentOS7,CentOS8安装Nodejs环境
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Thymeleaf,官方推荐html解决方案