RAG 与长文本,此消彼长还是相辅相成?
上周,PingCAP AI Lab 数据科学家孙逸神的文章《当前都在堆长窗口,还需要 RAG 吗?》从用户的角度谈了长窗口&RAG 的看法,引起了众多同行的围观,本周我们采访了张粲宇,看看搞向量数据库的业内人士,是怎么看待这个问题的? 作者简介 张粲宇,Zilliz Senior Product Manager。Milvus 产品负责人,主导向量数据库 Milvus 关键特性的定义与产品路线图的规划,Ask AI 项目负责人。 Ask AI,一个基于 RAG 技术搭建的企业级产品文档问答机器人。 01 探索大模型的打开方式:RAG 与长文本 随着 GPT-4o 与 Astra 在 Google IO 大会上的发布,生成式人工智能(AIGC)的进程再次加速。在大模型的多模态能力与效果百花齐放的同时,性价比已然成为各大模型公司竞争的主要策略。经过这一年多的狂飙,相较于过去简单粗暴地依赖 Scaling Law 无视成本地堆积算力,现在 AIGC 的发展更加贴近实际应用,使用场景也逐渐明晰。人们开始以更务实和落地的视角来探索大模型的正确使用方式。 在众多大模型的打开方式中,检索增强...

