华为开发者空间：基于DeepSeek构建RAG向量数据库

2025-03-04 518

摘要：让大家熟悉如何通过云主机部署DeepSeek，并且通过本地部署的DeepSeek快速搭建RAG向量数据库。

本文分享自华为云社区《本地部署DeepSeek构建RAG向量数据库》，作者：开发者空间小蜜蜂。

如您还没有云主机，可点击链接，根据领取指南进行操作。

一、案例介绍

本文将介绍如何通过在云主机部署Deepseek模型，在基于本地部署的前提下快速搭建属于自己的RAG向量数据库。RAG是检索增强生成（Retrieval-Augmented Generation，简称 RAG）是一种结合信息检索和生成式 AI 的技术架构。RAG 通过从外部知识库（如文档、数据库）中检索相关信息，并将其作为上下文输入给 LLM（大型语言模型），从而提高回答的准确性，减少幻觉问题。

通过实际操作，让大家熟悉如何通过云主机部署DeepSeek，并且通过本地部署的DeepSeek快速搭建RAG向量数据库！

二、案例时间

本案例总时长预计60分钟。

三、案例流程

说明：

① 云主机安装Ollama；

② 使用Ollama部署DeepSeek和mxbai-embed-large词向量模型；

③ 云主机获取项目代码及调取本地DeepSeek；

④ 上传数据集，构建RAG向量数据库。

四、资源总览

本案例预计花费总计 0 元。

资源名称	规格	单价（元）	时长（分钟）
云主机	2vCPUs \| 4GB X86 Ubuntu 22.04 Server定制版	免费	60

五、云主机部署DeepSeek

5.1安装Ollama

Ollama 是一个强大的开源工具，旨在帮助用户轻松地在本地运行、部署和管理大型语言模型（LLMs）。它提供了一个简单的命令行界面，使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构，并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。

在云主机桌面右键选择“ Open Terminal Here ”，打开命令终端窗口。

执行安装命令如下：

curl -fsSL https://ollama.com/install.sh | sh

5.2模型部署

接下来可以借助 Ollama 工具来部署 Deepseek 大模型，部署 deepseek-r1:1.5b 版本，执行命令：

ollama run deepseek-r1:1.5b

部署的时间长短依赖于网络的情况，部署完成后，我们就可以与 Deepseek 大模型进行对话了：

在桌面重新打开一个终端将以下命令复制进去，下载mxbai-embed-large 词向量模型。

ollama pull mxbai-embed-large

六、RAG向量数据库创建

6.1虚拟环境创建

打开云主机桌面CodeArts IDE for Python。

打开后，点击新建工程，输入工程名称：RAG，点击创建。

创建好后，左下角选择管理->设置。

在搜索框中输入：active，找到图中所示，在前方方框中点击勾选。

打开终端，前方出现（venv）字样表示创建成功，如果没有请点击 小垃圾桶图标 关闭终端重新打开一下。

6.2 RAG向量数据库构建

左下角打开终端输入命令，入完毕后按下回车进行下载。下载完毕后，在左侧目录下出现chatpdf-rag-deepseek-r1文件夹表示下载成功。

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1

下载完毕后，再次输入以下命令，输入完毕后按下回车，进入该目录下。

cd chatpdf-rag-deepseek-r1

进入到目录后在终端复制以下命令下载相应环境包。

pip install -r requirements.txt

6.3 RAG向量数据库功能实现

下载完毕后，点击后进入chatpdf-rag-deepseek-r1目录，对rag.py文件进行修改。修改rag.py文件的第23行代码，修改后的效果如下：

def __init__(self, llm_model: str = "deepseek-r1:1.5b", embedding_model: str = "mxbai-embed-large"):

修改完毕后，终端输入以下命令运行，首次运行可能会出现输入Email，出现时输入自己常用Email即可，输入完毕后效果如下：

streamlit run app.py

同时浏览器会自动弹出网址界面。

图示英文字符的意思如下：

Upload a Docunment：上传文档；

Settings（Number of Retrieved Results (k)）：检索结果数；

Similarity Score Threshold：相似度得分阈值；

Chat History：聊天记录；

Message：提示信息。

注：上传的文档格式需要为PDF格式。

这里我们将提前准备好的数据进行上传。

数据可以前往以下地址自行下载获取，上传的数据中包括AI的基础理论知识以及常用的AI框架的介绍，这里上传数据是为了使大模型能够进行RAG向量数据库的生成，使DeepSeek可以读取到数据库中的内容。

https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0026/%E6%95%B0%E6%8D%AE.pdf

下载完毕后点击图中’Browse files’字样进行数据上传。

点击后选择下载的数据，再点击打开进行数据上传。

上传后等待读取（过程需要一点时间请耐心等待），数据中包含AI方面的基础知识，所以我们进行问题提问，这里提问：机器学习有哪些核心技术？，输入完毕后回车发送消息。

可以看到返回信息，结合我们上传的数据进行检索生成。

至此本地部署DeepSeek构建RAG向量数据库实验案例到此结束。

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/17819970

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

基于Flink的配置化实时反作弊系统

导读本文详细阐述了基于Flink构建的实时反作弊流式过滤系统，针对大流量场景下的复杂特征计算、高频策略热更新、模拟过滤验证及多场景数仓对接等核心挑战，提出来多项解决方案，实现了秒级特征计算的实时过滤功能，有效支撑高并发场景下的精准风控判定，并通过ClickHouse与图灵双链路数据输出，满足实时监控与离线分析的多样化需求，为互联网业务提供了高吞吐、低延迟、强稳定的实时反作弊解决方案。 01 简介在互联网业务高速发展的今天，反作弊已成为APP厂商生态稳定运行的重要保障。作弊行为层出不穷，包括恶意点击、刷单、羊毛党等，这些行为不仅会破坏平台公平性，还可能造成巨大的经济损失。因此，构建一个高效、灵活、可扩展的实时反作弊系统变得尤为重要。反作弊系统根据业务属性和时效性可分为三类：在线反作弊、实时反作弊与离线反作弊。其中，在线反作弊具备最高的时效性，能够即时响应风险；离线反作弊依托最全面的信息，支持深度分析与建模；而实时反作弊则兼具二者优势，提供平衡的时效性与信息丰富度。在线反作弊系统通过快速处理简单指标进行判断，例如分析当前请求携带的字段信息，并结合基于 Redis 的简单累计值（如访...

2025-03-04

460

功能简介 IvorySQL v4 基于 PostgreSQL 17，引入了逻辑复制槽同步至热备份数据库的功能。这一改进有效解决了旧版本中主数据库与备份数据库切换后逻辑复制中断的问题。对于那些追求数据高可用性和业务连续性的数据库来说，这无疑是一个重大的利好消息。它不仅提升了系统的整体稳定性，还确保了在故障发生时，数据复制过程能够无缝继续，从而最大程度地降低了业务中断的可能性。复制槽同步机制前提条件物理复制槽：主数据库与备份数据库之间必须存在物理复制槽，作为逻辑复制槽同步的基础，确保数据在主备之间有效传输。。配置参数：在备份数据库上配置 primary_slot_name 参数，并在使用 pg_basebackup 工具时指定复制槽。这一配置步骤确保了备份数据库能够正确接收主数据库数据。启用备份数据库的 hot_standby_feedback 功能，确保其能接收并反馈 WAL 日志。这一功能的启用保证了备份数据库在接收数据时的活跃性和反馈机制的完整性。在 primary_conninfo 参数中指定有效的数据库名称（dbname）。这一配置确保了复制过程中的目标数据库是明...

2025-03-04

410

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。