面向教育场景的大模型 RAG 检索增强解决方案

2025-01-03 304

概述

在现代信息检索领域，检索增强生成（Retrieval-Augmented Generation, RAG）模型结合了信息检索与生成式人工智能的优点，从而在特定场景下提供更为精准和相关的答案。在特定场景下，例如教育等领域，用户通常需要精确且相关的信息来支持决策。传统生成模型虽然在自然语言理解和生成方面表现良好，但在专业知识的准确性上可能有所不足。RAG模型通过将检索与生成相结合，能有效提升回答的准确性和上下文相关性。本方案为您介绍，如何使用人工智能平台 PAI 构建面向教育场景的大模型 RAG 检索增强解决方案。

1.使用PAI-Designer构建知识库

您可以参照数据格式要求准备，使用PAI-Designer构建相应的检索知识库。

2.使用PAI-LangStudio进行模版构建

您在LangStudio中使用预置的RAG模版进行定制化，创建适合具体应用的模板。

3.使用PAI-Langstudio构建在线应用

LangStudio提供了用户友好的界面，使用户能够轻松提交查询并获取答案。您可以使用创建好的模板构建符合业务需求的在线应用。

一、前置准备

在开始执行操作前，请确认您已完成以下准备工作：

●已开通PAI后付费，并创建默认工作空间，详情请参见开通PAI并创建默认工作空间。

●已创建OSS存储空间（Bucket），用于存储训练数据。关于如何创建存储空间，详情请参见控制台创建存储空间。

●已开通Milvus数据库，用于构建指数库的向量存储，详情请参见快速创建milvus实例

1.准备数据集

在使用PAI-Designer构建知识库的过程中，您首先需要根据特定领域的需求，准备并整理好适合的数据集。这些数据往往涉及到该领域的专业内容，需确保数据的准确性和完整性。PAI-Designer提供了一套便捷的工具和接口，帮助用户轻松导入和管理这些数据。在本解决方案中，我们以医疗为例，展示使用CSV作为原始数据，使用PAI-Designer构建知识库的的步骤。

您需要确保数据格式符合PAI-Designer的要求，例如CSV格式。可以通过对领域文档进行预处理和格式化，提取其中的关键信息。

1.1数据示例

以下给出教育领域的数据的示例，格式为csv，主要内容为维基百科上的生物课程内容知识点，用户可以根据需要准备自己的数据：

该示例数据集已经放置于公开的oss bucket中，可以使用wget下载，下载后请用户将数据上传到自己的oss bucket中，以供下一步使用：

wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/solutions/rag/data/%E6%95%99%E8%82%B2csv.zip

2.部署LLM和Embedding模型

1.前往快速开始 > ModelGallery，分别按场景选择大语言模型及Embedding分类，并部署指定的模型。本文以通义千问2.5-7B-Instruct和bge-large-zh-v1.5 通用向量模型为例进行部署。请务必选择使用指令微调的大语言模型（名称中包含“Chat”或是“Instruct”的模型），Base模型无法正确遵循用户指令回答问题。

2.前往任务管理，单击已部署的服务名称，在服务详情页签下单击查看调用信息，分别获取前面部署的LLM和Embedding模型服务的VPC访问地址和Token，供后续创建连接时使用。

3.创建LLM链接

1.进入LangStudio，选择工作空间后，在连接管理页签下单击新建连接，进入应用流创建页面。

2.创建通用LLM模型服务连接。其中base_url和api_key分别对应【2. 部署LLM和Embedding模型】中LLM的VPC访问地址和Token。

4.创建Embedding模型服务连接

同【3. 创建LLM链接】，创建通用Embedding模型服务连接。其中base_url和api_key分别对应【2. 部署LLM和Embedding模型】中Embedding模型的VPC访问地址和Token。

5.创建向量数据库连接

同【3. 创建LLM链接】，创建Milvus数据库连接。

关键参数说明：

●uri：Milvus实例的访问地址，即http://<Milvus内网访问地址>，Milvus内网访问地址如下：

则uri为http://c-b1c5222fba****-internal.milvus.aliyuncs.com。

●token：登录Milvus实例的用户名和密码，即:<yourUsername>:<yourPassword>。

●database：数据库名称，本文使用默认数据库default。

二、使用PAI-Designer构建知识库

使用PAI-Designer构建知识库索引工作流主要包含以下几个步骤:

1.使用数据源读取组件，读取OSS中的数据。

2.使用文本解析分块组件，对文本进行分块。

3.使用向量生成组件，对分块后的文本进行向量化。

4.使用索引存储组件，将向量化后的文本存储到向量数据库。

PAI-Designer工作流串联示例

您可以打开PAI-Designer，选择LLM大语言模型中的检索增强生成构建自己的知识库。

进入工作流后，您会看到下面的工作流，接下来依次介绍各个模块的作用以及需要填写的参数。

RAG读取OSS数据

选择存储数据的OSS Bucket，确保Bucket中已经保存好相关的文档数据（可以为pdf/csv格式）。

RAG文本解析分块

对输入的文件进行分块处理，填入块大小和块重叠大小的参数，并选择OSS Bucket保存分块完成的数据。

RAG文本向量生成

使用embedding模型，对分块完成的数据进行向量化并存储，便于后续的检索操作。

RAG索引构建

使用先前创建的milvus数据库，存储已经生成的文档向量。其中向量数据库选择自己创建的数据库，为存储的文档向量取一个名称，填入集合/表名称中；相似度度量可以选择点积、余弦、欧几里得的方式；并选择一个OSS Bucket保存RAG的索引。

三、使用PAI-LangStudio进行模版构建

PAI-LangStudio是一个人工智能应用的开发平台，采用直观的交互式环境，简化了企业级大模型应用的开发流程。在开发和设计大模型应用时，可以使用PAI-LangStudio进行模版构建。此外，PAI-LangStudio配合一键部署EAS，使得高质量应用得以迅速、无缝地部署至生产环境。以下介绍使用PAI-LangStudio进行模版构建的过程

新建应用流

1.进入LangStudio，选择工作空间后，在应用流页签下单击新建应用流，进入应用流创建页面。

2.选择从模板新建，并在选择RAG模板后填入应用流名称，在OSS Bucket中选择存储应用流的路径。

配置应用流

创建应用流后会进入应用流详情界面，左图中有四个节点，分别对应了不同的功能。

1.rewrite_question节点通过对用户问题的重写以提升问题质量，其中需要用户在基础配置中选择connection为【前置准备3. 创建LLM连接】中创建好的连接。

2.retrieve节点通过向量数据库召回和问题相关的文档内容，Vector Store需要用户选择【前置准备5. 创建向量数据库】中创建好的数据库以及在index_name中填入【使用PAI-Designer构建知识库-RAG索引构建】中填入的集合/表名；Embedding Model中需要用户选择【前置准备4. 创建Embedding模型服务连接】中创建的连接。

3.threshold_filter节点对retrieve节点召回的文档进行过滤，填入的threshold值是对召回文档和查询问题相似度过滤的条件，threshold越大，则过滤掉越多召回的相似度低的文档。

4.generate_answer节点根据召回和过滤后的文档，回答问题。用户需要在基础配置中选择【前置准备3. 创建LLM连接】中创建好的LLM连接。

四、使用PAI-Langstudio构建在线应用

1.配置完上述流程后，点击启动运行时，并选择机型，配置专有网络链接，部署RAG应用。

2.运行时启动后，点击对话按钮，在左侧对话框中输入想问的问题，与大语言模型开始交流对话。

五、案例对比

以下给出教育领域，使用和不使用RAG解决特定任务的案例对比。红色部分表示大模型回答有事实性错误，或者不够具体精确，绿色部分表示使用RAG得到的对应正确回复。

任务一：学科知识问答

问题：请简述一下科学家发现减数分裂现象的过程。

任务二：智能批改和反馈

问题：请指出下面关于光合作用起源论述的错误点。

论述：地球上的光合作用起源于太古宙早期，当时的自养生物主要依靠叶绿素作为光捕获色素的中心，专注于吸收可见光谱中的绿色波长。通过这一过程，它们能够分解水分子固定二氧化碳，将其转化为碳水化合物。在这一代谢过程中，氧气作为副产品被释放出来。作为生态系统的基石，光合自养生物通过产生有机物质，为异养生物（包括消费者和分解者）提供了食物来源，进而通过食物链将能量传递给生态系统中更高营养级的其他生物。

微信关注我们

原文链接：https://my.oschina.net/u/5583868/blog/17031008

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2024年社区高光时刻总结！

亲爱的朋友们，让我们把时间的快门按下，一起回顾这一年的点点滴滴。就像翻阅一本精彩的相册，每一张照片都记录着我们Apache DolphinScheduler社区的欢笑和泪水。那么，准备好了吗？让我们一起跳进时光机，回顾社区里2024年那些难忘的瞬间吧！时光荏苒，新年将至，2025年，愿我们所有人的梦想照进现实，愿所有愿美好如期而至！本文由白鲸开源科技提供发布支持！

2025-01-02

246

GreatSQL temp文件占用时长分析 GreatSQL DBA在日常工作中可能会遇到这种情况，存在一个 InnoDB 引擎下的 temp_x.ibt 文件很大，但是却无法确定这个文件是什么时间由哪个连接建立的，难以支撑后续定位问题，今天这篇文章彻底讲明白这个问题。现象：发现一个实例下面（4406端口对外提供服务的实例）temp文件很大，如下所示： -rw-r----- 1 greatsql greatsql 81920 Sep 26 23:56 temp_1.ibt -rw-r----- 1 greatsql greatsql 81920 Sep 30 16:43 temp_10.ibt -rw-r----- 1 greatsql greatsql 81920 Sep 26 23:56 temp_2.ibt -rw-r----- 1 greatsql greatsql 81920 Sep 26 23:56 temp_3.ibt -rw-r----- 1 greatsql greatsql 81920 Sep 26 23:56 temp_4.ibt -rw-r----- 1 gr...

2025-01-03

271

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。