您现在的位置是:首页 > 文章详情

华为开发者空间:基于DeepSeek构建RAG向量数据库

日期:2025-03-04点击:28
摘要:让大家熟悉如何通过云主机部署DeepSeek,并且通过本地部署的DeepSeek快速搭建RAG向量数据库。
本文分享自华为云社区 《本地部署DeepSeek构建RAG向量数据库》 ,作者:开发者空间小蜜蜂。
 
如您还没有云主机,可点击 链接 ,根据领取指南进行操作。

一、案例介绍

本文将介绍如何通过在云主机部署Deepseek模型,在基于本地部署的前提下快速搭建属于自己的RAG向量数据库。RAG是检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种结合信息检索和生成式 AI 的技术架构。RAG 通过从外部知识库(如文档、数据库)中检索相关信息,并将其作为上下文输入给 LLM(大型语言模型),从而提高回答的准确性,减少幻觉问题。
通过实际操作,让大家熟悉如何通过云主机部署DeepSeek,并且通过本地部署的DeepSeek快速搭建RAG向量数据库!

二、案例时间

本案例总时长预计60分钟。

三、案例流程

说明:
① 云主机安装Ollama;
② 使用Ollama部署DeepSeek和mxbai-embed-large词向量模型;
③ 云主机获取项目代码及调取本地DeepSeek;
④ 上传数据集,构建RAG向量数据库。

四、资源总览

本案例预计花费总计 0 元。
资源名称
规格
单价(元)
时长(分钟)
云主机
2vCPUs
| 4GB X86
Ubuntu
22.04 Server定制版
免费
60

五、云主机部署DeepSeek

5.1安装Ollama

Ollama 是一个强大的开源工具,旨在帮助用户轻松地在本地运行、部署和管理大型语言模型(LLMs)。它提供了一个简单的命令行界面,使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构,并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。
在云主机桌面右键选择“ Open Terminal Here ”,打开命令终端窗口。
 
执行安装命令如下:
curl -fsSL https://ollama.com/install.sh | sh
 
 

5.2模型部署

接下来可以借助 Ollama 工具来部署 Deepseek 大模型,部署 deepseek-r1:1.5b 版本,执行命令:
ollama run deepseek-r1:1.5b
 
 
部署的时间长短依赖于网络的情况,部署完成后,我们就可以与 Deepseek 大模型进行对话了:
 
 
在桌面重新打开一个终端将以下命令复制进去,下载mxbai-embed-large 词向量模型。
ollama pull mxbai-embed-large
 

六、RAG向量数据库创建

6.1虚拟环境创建

打开云主机桌面CodeArts IDE for Python。
 
 
打开后,点击新建工程,输入工程名称:RAG,点击创建。
 
 
创建好后,左下角选择管理->设置。
 
 
在搜索框中输入:active,找到图中所示,在前方方框中点击勾选。
 
 
打开终端,前方出现(venv)字样表示创建成功,如果没有请点击 小垃圾桶图标 关闭终端重新打开一下。
 
 

6.2 RAG向量数据库构建

左下角打开终端输入命令,入完毕后按下回车进行下载。下载完毕后,在左侧目录下出现chatpdf-rag-deepseek-r1文件夹表示下载成功。
git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1
 
 
下载完毕后,再次输入以下命令,输入完毕后按下回车,进入该目录下。
cd chatpdf-rag-deepseek-r1
 
 
进入到目录后在终端复制以下命令下载相应环境包。
pip install -r requirements.txt
 
 

6.3 RAG向量数据库功能实现

下载完毕后,点击后进入chatpdf-rag-deepseek-r1目录,对rag.py文件进行修改。修改rag.py文件的第23行代码,修改后的效果如下:
def __init__(self, llm_model: str = "deepseek-r1:1.5b", embedding_model: str = "mxbai-embed-large"):
 
 
修改完毕后,终端输入以下命令运行,首次运行可能会出现输入Email,出现时输入自己常用Email即可,输入完毕后效果如下:
streamlit run app.py
 
 
同时浏览器会自动弹出网址界面。
 
图示英文字符的意思如下:
 
Upload a Docunment:上传文档;
Settings(Number of Retrieved Results (k)):检索结果数;
Similarity Score Threshold:相似度得分阈值;
Chat History:聊天记录;
Message:提示信息。
 
注:上传的文档格式需要为PDF格式。
 
这里我们将提前准备好的数据进行上传。
 
数据可以前往以下地址自行下载获取,上传的数据中包括AI的基础理论知识以及常用的AI框架的介绍,这里上传数据是为了使大模型能够进行RAG向量数据库的生成,使DeepSeek可以读取到数据库中的内容。
 
下载完毕后点击图中’Browse files’字样进行数据上传。
 
 
点击后选择下载的数据,再点击打开进行数据上传。
 
 
上传后等待读取(过程需要一点时间请耐心等待),数据中包含AI方面的基础知识,所以我们进行问题提问,这里提问:机器学习有哪些核心技术?,输入完毕后回车发送消息。
 
可以看到返回信息,结合我们上传的数据进行检索生成。
 
至此本地部署DeepSeek构建RAG向量数据库实验案例到此结束。
 
原文链接:https://my.oschina.net/u/4526289/blog/17819970
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章