LazyLLM x MemU：20 行代码打造有长记忆的知识问答助手

2025-11-03 63

在开发知识问答助手的过程中，常见的挑战之一就是如何让智能体记住之前的对话和交互内容。

很多应用在实现多轮问答时，会遇到信息丢失或上下文混乱的问题：用户提过的问题、提供的数据、甚至助手之前的回答都无法被系统持续记忆，导致体验断层。对于企业级知识库或面向用户的个人助手来说，这种缺失不仅影响回答的准确性，也使得智能体难以形成长期价值。

构建一个能够记忆的问答系统，并非简单地将对话记录写入数据库。

智能体需要对历史信息进行结构化存储、动态检索，并在生成回答时合理利用这些信息。开发者在设计过程中常常要面对如何组织记忆、何时触发检索、如何在保证性能的同时处理大规模知识等问题。即便在开源框架和大模型辅助下，真正实现一个可落地、可维护的记忆系统仍然需要大量工程工作。

因此，我们将 LazyLLM与MemU进行集成，提供了一个可直接落地的解决方案。LazyLLM 是一站式多 Agent 开发框架，能够高效管理智能体的任务和上下文。MemU 作为开源记忆管理系统，可提供灵活且高性能的记忆存储与检索能力；

通过这次集成，开发者可以在 20 行左右的代码的基础上，快速搭建一个具备记忆能力的知识问答助手，让智能体能够在多轮交互中持续积累知识，并在实际应用中真正发挥价值。

案例一

1. 新建问答 Agent，进行对话

2. 新建对话，重新问 Agent，Agent已获取到相关记忆

案例二

1. 与 Agent 对话，聊个人喜好

2. Agent 会在对话中主动提及过往聊到的喜好

教程

LazyLLM x MemU |记忆赋能，让问答助手更懂你。

查看教程文档 👇

https://hkadx4xptq.feishu.cn/wiki/By6IwM7Kfinyf0kbM1xcrrcfnnd

通过本次集成操作，开发者可以在 LazyLLM 中快速接入memU 的 Memory API，快速搭建一个具备记忆能力的知识问答助手，实现多轮对话的知识积累与检索。在实际开发中，可以根据业务场景调整记忆策略，灵活管理存储与调用方式，让智能体在面对用户时更智能、更高效。

更多技术细节，欢迎移步 “LazyLLM” gzh！

微信关注我们

原文链接：https://my.oschina.net/u/8690838/blog/18698348

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

在 Elastic 中使用 GPU 推理进行语义搜索

作者：来自ElasticSean Handley及Max Jakob 了解 Elastic 的 EIS 如何利用 GPU 推理和 ELSER 来支持快速、准确的语义搜索。测试 Elastic 的领先、开箱即用的功能。深入了解我们的示例笔记本，开始免费云试用，或立即在本地计算机上试用 Elastic。今年，Elastic 的推理工具推出了由GPU 驱动的 Elastic 推理服务（EIS），提供了一个平台，通过始终在线的专用服务简化了对 LLM、嵌入和重新排序模型的访问。今天，我们将重点介绍 EIS 如何使用我们的稀疏嵌入模型 ELSER（Elastic Learned Sparse EncodeR）简化语义搜索体验。将语义搜索作为基础可以帮助解锁许多其他能力，包括混合检索以及能够为您的代理工作流程的 LLM 提供良好的上下文。让我们开始吧！开始使用语义搜索现在，你可以使用由 EIS 提供支持的推理端点，开始端到端的语义搜索用例。使用新端点创建语义文本字段首先，让我们使用 semantic_text 字段类型和 EIS 推理 ID .elser-2-elastic 创建一...

2025-11-03

61

2025 年 10 月 30 日，RWKV7-G0a3 7.2B 推理模型开源发布。它基于 RWKV7-G0a2 7.2B 继续训练高质量数据，显著提升能力。 RWKV 模型名称的 G1/G1a/G1a2/G0a3 等字段是训练数据的版本，数据质量 G#a3 > G#a2 > G#a > G#，数据数量 G1 > G0。简单规则：同一参数选择最新的模型，效果最好。模型性能评估 MMLU & MMLU PRO 评估模型在多学科知识的综合能力（MMLU PRO 难度比 MMLU 更高）。 GSM8K 评估模型在中学难度数学应用题的推理能力。 MATH500 测试模型在更难数学问题的解题能力。 CEval 以多行业真实试题，评估模型中文理解和专业知识。模型实战 G0a3 模型加入更多数据，显著提升 vibe coding 能力。回顾上版模型：RWKV7-G0a2 7.2B发布：纯RNN也能vibe coding 代码推荐解码参数：Temperature=1，Top_P=0.3，Presence Penalty=1，Frequency Penalty=0.1...

2025-11-03

102

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。