LazyLLM教程 | 第8讲:不止是cosine!匹配策略决定你召回的质量
在前面教程中,我们介绍了如何通过查询重写、各种优化检索策略和召回重排策略来提升检索模块的召回率。其中影响检索召回文档质量的一个关键组件为 similarity,它的作用是用来计算检索的文档和查询 query 之间的相似度。 LazyLLM 默认提供的相似度计算函数为 bm25(分为英文和中文) 相似度计算,余弦相似度计算方法。其中 bm25 算法主要针对文本进行计算,而余弦相似度算法主要针对 embedding 进行计算。如果 LazyLLM 提供的默认相似度计算方法不能满足自己的需求,可以自己来设计定义符合自己需求的相似度计算方法。与 Similarity 组件相似,本教程同时介绍 Transform的自定义方法。 本教程主要介绍如何使用自定义 Similarity 组件和 Transform的方法,读完本教程,您将学会 LazyLLM 中自定义 Similarity 和 Transform的方法,并基于 Similarity 和 Transform分别搭建一个简单的RAG应用。 为什么要自定义 Similarity 在 RAG服务中,检索模块的效果直接影响生成结果的相关性与准确性...