Meta 超级智能实验室推出新技术，使大模型 RAG 推理速度提升 30 倍-低调大师

Meta 超级智能实验室推出新技术，使大模型 RAG 推理速度提升 30 倍

2025-10-14 118

Meta 的超级智能实验室（Meta Superintelligence Labs，MSL）发表了首篇重要论文，研究成果显著提升了大语言模型在检索增强生成(RAG)任务中的推理速度，提升幅度达到了30倍以上。

这篇论文名为《REFRAG:Rethinking RAG based Decoding》，主要探讨如何让大型语言模型在执行 RAG 任务时，快速提炼出重要信息，以减少计算量并缩短反应时间，而同时保持准确性不变。

Meta 超级智能实验室于今年6月正式成立，总部位于加利福尼亚州的门洛帕克，旨在研发超级智能技术。根据报道，扎克伯格在4月份对 Meta 最新发布的 Llama4模型表现不满，甚至要求员工加班加点来改进。这促使他成立了这个新实验室，并引入了大量顶尖人才，包括 Scale AI 的创始人 Alexandr Wang。

在实验室内部，团队被分为四个小组，分别负责大语言模型的研发、人工智能基础研究、产品技术落地以及基础设施的保障。REFRAG 框架的提出，正是实验室在优化大语言模型性能方面的第一步。

REFRAG 框架的核心理念是，通过一个轻量级模型将冗长的上下文内容压缩成摘要，减少解码器处理的输入信息。这种方法不仅加快了处理速度，还降低了计算量，提高了模型的效率。此外，研究团队还采用了 “持续预训练” 的方法，通过重建任务训练模型，以便在压缩信息的同时，尽量保留重要的细节。

经过全面测试，REFRAG 在多种任务中表现出色，尤其在时间延迟和吞吐量方面大幅提升。实验结果显示，REFRAG 在压缩比为16倍的情况下，能够在速度上超越之前的最先进模型 CEPE，并且在准确性上几乎没有损失。

微信关注我们

原文链接：https://www.oschina.net/news/377303

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Rancher 社区双周报｜ Longhorn v1.10.0 重磅发布

在本期 Rancher 社区双周报中，我们为大家带来了多个核心产品的最新版本动态： Longhorn 发布了 v1.9.2 与 v1.10.0 两个版本，其中 v1.10.0 引入了 V2 Data Engine 的重大增强，带来更高性能与更强扩展性； Rancher 发布了四个版本（v2.9.12、v2.10.10、v2.11.6、v2.12.2），其中多个 Prime 版本聚焦于安全修复与系统稳健性提升； RKE2 与 K3s 分支均完成了 Kubernetes 版本的例行更新，优化核心组件并强化集群可靠性；同时，Harvester v1.5.2 带来了更流畅的虚拟化体验，K3k v0.3.5 则在资源同步与镜像管理方面持续进化。这一系列更新共同展现了 Rancher 技术生态的持续完善与活力，为用户在容器、虚拟化与边缘计算场景中的落地提供了更加坚实的基础。 Longhorn Longhorn 发布了 v1.9.2 与 v1.10.0 两个版本更新。本次更新聚焦于系统稳定性与性能增强，同时引入了多项新特性与兼容性优化，进一步提升了 Longhorn 在企业级云原生存储场景中的...

2025-10-14

79

蚂蚁百灵大模型团队正式发布了万亿思考模型Ring-1T。发布即开源，开发者可以通过Hugging Face、魔搭社区下载模型权重，也可以通过Ling Chat页面和ZenMux 进行直连模型的chat体验和API 调用。 Hugging Face：https://huggingface.co/inclusionAI/Ring-1T ModelScope：https://modelscope.cn/models/inclusionAI/Ring-1T Ling chat（国内用户）：https://ling.tbox.cn/chat ZenMux（海外开发者，Chat/API ）：https://zenmux.ai/inclusionai/ring-1t Ring-1T是一款基于Ling 2.0架构的万亿参数思考模型。其总参数量达到1万亿，激活参数为500亿，并支持128K上下文窗口。模型权重已同步上线Hugging Face与ModelScope，同时提供了FP8版本。正式版在上月底发布的 preview 版本基础上，持续扩展大规模可验证奖励强化学习（RLVR）训练，进一步激发万亿基...

2025-10-14

187

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。