当搜索遇上大模型:开发者怎样把传统搜索系统升级成 AI 搜索?
在生成式 AI 已经深入业务的今天,搜索系统的角色正在发生很明显的变化。用户对搜索的期望不再局限于关键词匹配,而是希望系统具备语义理解、多模态处理以及实时推理能力。传统的全文检索依旧是基础,但很难覆盖这些新需求,搜索逐渐成为 AI 应用的核心底座。 Elastic 中国首席布道师刘晓国在 GOTC 2025 全球开源技术峰会的演讲提到了一个更实际的问题:在现有技术栈中,如何用向量搜索、混合搜索、RAG 和 Agentic 技术,构建面向未来的搜索体验。 随着用户行为不断变化,搜索系统面对的挑战和过去已经不一样。词法检索继续发挥作用,但复杂的查询方式需要新的方法。语义搜索、跨模态检索、模型重排序以及 RAG 结构正在成为主流。核心难题集中在两点:系统是否理解用户的真实意图,以及模型是否能访问企业内部的实时数据。向量搜索和混合搜索为这两个问题提供了关键能力。 混合搜索通过结合 BM25、向量相似度和 RRF 这样的排序方法,让语义召回和关键词匹配形成互补,使得结果更稳定。本次分享也对构建搜索系统的流程进行了完整拆解:先加载 embedding 模型,再在数据写入时生成向量,查询时同时使用 ...
