当搜索遇上大模型：开发者怎样把传统搜索系统升级成 AI 搜索？-低调大师

当搜索遇上大模型：开发者怎样把传统搜索系统升级成 AI 搜索？

2025-11-28 58

在生成式 AI 已经深入业务的今天，搜索系统的角色正在发生很明显的变化。用户对搜索的期望不再局限于关键词匹配，而是希望系统具备语义理解、多模态处理以及实时推理能力。传统的全文检索依旧是基础，但很难覆盖这些新需求，搜索逐渐成为 AI 应用的核心底座。

Elastic 中国首席布道师刘晓国在 GOTC 2025 全球开源技术峰会的演讲提到了一个更实际的问题：在现有技术栈中，如何用向量搜索、混合搜索、RAG 和 Agentic 技术，构建面向未来的搜索体验。

随着用户行为不断变化，搜索系统面对的挑战和过去已经不一样。词法检索继续发挥作用，但复杂的查询方式需要新的方法。语义搜索、跨模态检索、模型重排序以及 RAG 结构正在成为主流。核心难题集中在两点：系统是否理解用户的真实意图，以及模型是否能访问企业内部的实时数据。向量搜索和混合搜索为这两个问题提供了关键能力。

混合搜索通过结合 BM25、向量相似度和 RRF 这样的排序方法，让语义召回和关键词匹配形成互补，使得结果更稳定。本次分享也对构建搜索系统的流程进行了完整拆解：先加载 embedding 模型，再在数据写入时生成向量，查询时同时使用 match 和 kNN，并且支持过滤条件。从 8.7+ 开始，query_vector_builder 可以在查询时自动生成向量，让整个流程更加直接。

在底层能力上，向量引擎的更新同样是重点内容。硬件加速覆盖 CPU 指令集和 GPU/CAGRA，向量压缩带来 int8 和 int4 的成本优势，新向量存储格式如 DiskBBQ 提升了存储与检索的效率，并且在高并发下通过线程协同来降低延迟、提升吞吐。这些能力让百万级到十亿级规模的向量检索能够在实际业务中稳定落地。

搜索趋势也在向“重排序优先”的方向演进。分享中展示了从 BM25、ANN、稀疏召回，到 Query Rescorer、LTR，再到 Cohere Rerank、Elastic Reranker 等模型重排的完整路径。系统先快速缩小候选集，再通过更强的模型提升精度，从而在成本和效果之间取得平衡。

RAG 在企业中的落地速度很快，因为大模型本身的知识是冻结的，无法反映企业实时数据，所以必须依赖检索系统来补充外部信息。在这个模式下，混合搜索天然占有优势。分享中也展示了分块策略对召回的影响，并说明了 Elasticsearch 在自动分块和语义字段类型方面提供的简化能力。进一步的发展方向是 Agentic RAG。它让系统从回答问题扩展到执行任务，包括规划、判断和自主选择工具。分享中展示的示例包括使用 MCP server、在 Kibana 中构建 Agents，以及与 Gemini Enterprise 的 A2A 协议集成，这让搜索能力不再停留在数据入口，而是延伸到完整的 AI 决策链路。

回到整体趋势，搜索的形态正在发生结构性变化。词法搜索继续提供稳定基座，向量搜索补充语义能力，混合搜索让两者协同，而重排序与 Agentic 工作流进一步提升系统的智能化水平。对于开发者和技术管理者来说，这套能力组合提供了非常明确的技术路径，让搜索从信息查找拓展到智能行为触发，并能够为未来的 AI 应用奠定基础。

完整内容查看：https://www.oschina.net/doc/485

微信关注我们

原文链接：https://www.oschina.net/news/386385

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

模力方舟 Gitee AI，差点我就骂娘了！

心血来潮，想着用 AI IDE 和 AI 应用开发平台全套 AI 来写一个 AI 小工具，然后上来就直接卡在这个 AI 应用开发平台“模力方舟（也就是 Gitee AI）”上了。不过，上火就上了一会儿，因为我又用 AI 把问题解决了，后边一切通畅。所以本来差点就骂娘，搞到最后我的应用顺利发布了，回头我还得来夸一夸模力方舟这个 AI 应用开发平台。简单讲一下情况。当时我把应用的基本功能写好了跑通了，准备要集成模力方舟平台，其实我主要是集成它的上架、帐号体系、支付这些东西。然后，我把模力方舟的这两个开发者文档链接给我的 AI IDE，让它了解一下然后如何如何处理我要的集成部分。 https://ai.gitee.com/docs/appstore/intro https://ai.gitee.com/docs/openapi/v1 我发现好家伙，IDE 完全解析不了这文档链接，本来以为是防爬虫什么的，绕来绕去扯了半天，其中用了脚本去处理防爬的方式、使用 https://r.jina.ai/ 去解析的方式、直接复制页面去粘贴到本地的方式（但这方式比较恶心，因为页面多、而且还有前端展...

2025-11-28

78

韩国媒体报道称，三星电子宣布对半导体部门进行重大组织架构调整，正式解散成立仅一年的高带宽内存（HBM）特别开发团队，并将该团队的人员与相关业务整体并入DRAM开发部门下属的设计团队。此次调整在日前举行的高管内部通报会上正式公布，核心变动为撤销去年7月专为加速HBM研发而设立的独立团队。原团队成员将统一划归至DRAM开发体系，继续从事高性能存储技术的研发工作。这一变动意味着HBM业务不再以独立单元运作，而是融入主流存储芯片研发架构，强化与现有DRAM产品的协同开发能力。此前负责领导HBM特别团队的副社长孙永秀，已在新架构下被任命为DRAM部门设计团队负责人。他将延续原有职责，带领原班人马推进HBM4及HBM4E等下一代高性能存储产品的技术攻关。该特别团队成立于2023年5月，在全永铉接任半导体部门负责人后迅速组建，旨在集中资源应对当时在HBM市场竞争中落后于对手的局面。如今团队重组，距离其成立仅过去一年多时间。业内普遍认为，此次调整反映出三星已建立起在HBM4等前沿产品上的核心技术能力，摆脱了早期需通过临时团队紧急追赶的被动状态，开始转向更深层次的技术整合与系统化研发路径。

2025-11-28

66

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。