PageIndex - 基于推理的 RAG 系统
PageIndex 是一个基于推理的 RAG系统,它构建长文档的树状索引,并基于该索引进行推理以进行检索。它模拟了人类专家如何通过树状搜索从长文档中导航和提取知识,使语言学习者能够思考和推理,从而找到最相关的文档部分。它分两步执行检索:
- 生成文档的“目录”树状结构索引
- 通过树搜索执行基于推理的检索
功能
与传统的基于向量的 RAG 相比,PageIndex 具有以下特点:
- 无需向量:使用文档结构和 LLM 推理进行检索。
- 无需分段:文档按自然章节组织,而不是人为分段。
- 类人检索:模拟人类专家如何浏览和提取复杂文档中的知识。
- 透明检索过程:基于推理的检索——告别近似向量搜索(“感觉检索”)。
PageIndex 为基于推理的 RAG 系统提供支持,该系统在 FinanceBench 上达到了98.7% 的准确率,在专业文档分析方面展现了最先进的性能(详情可参阅博客文章)。
