Meta 超级智能实验室推出新技术,使大模型 RAG 推理速度提升 30 倍
Meta 的超级智能实验室(Meta Superintelligence Labs,MSL)发表了首篇重要论文,研究成果显著提升了大语言模型在检索增强生成(RAG)任务中的推理速度,提升幅度达到了30倍以上。
这篇论文名为《REFRAG:Rethinking RAG based Decoding》,主要探讨如何让大型语言模型在执行 RAG 任务时,快速提炼出重要信息,以减少计算量并缩短反应时间,而同时保持准确性不变。
Meta 超级智能实验室于今年6月正式成立,总部位于加利福尼亚州的门洛帕克,旨在研发超级智能技术。根据报道,扎克伯格在4月份对 Meta 最新发布的 Llama4模型表现不满,甚至要求员工加班加点来改进。这促使他成立了这个新实验室,并引入了大量顶尖人才,包括 Scale AI 的创始人 Alexandr Wang。
在实验室内部,团队被分为四个小组,分别负责大语言模型的研发、人工智能基础研究、产品技术落地以及基础设施的保障。REFRAG 框架的提出,正是实验室在优化大语言模型性能方面的第一步。
REFRAG 框架的核心理念是,通过一个轻量级模型将冗长的上下文内容压缩成摘要,减少解码器处理的输入信息。这种方法不仅加快了处理速度,还降低了计算量,提高了模型的效率。此外,研究团队还采用了 “持续预训练” 的方法,通过重建任务训练模型,以便在压缩信息的同时,尽量保留重要的细节。
经过全面测试,REFRAG 在多种任务中表现出色,尤其在时间延迟和吞吐量方面大幅提升。实验结果显示,REFRAG 在压缩比为16倍的情况下,能够在速度上超越之前的最先进模型 CEPE,并且在准确性上几乎没有损失。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Rancher 社区双周报| Longhorn v1.10.0 重磅发布
在本期 Rancher 社区双周报 中,我们为大家带来了多个核心产品的最新版本动态: Longhorn 发布了 v1.9.2 与 v1.10.0 两个版本,其中 v1.10.0 引入了 V2 Data Engine 的重大增强,带来更高性能与更强扩展性; Rancher 发布了四个版本(v2.9.12、v2.10.10、v2.11.6、v2.12.2),其中多个 Prime 版本聚焦于安全修复与系统稳健性提升; RKE2 与 K3s 分支均完成了 Kubernetes 版本的例行更新,优化核心组件并强化集群可靠性; 同时,Harvester v1.5.2 带来了更流畅的虚拟化体验,K3k v0.3.5 则在资源同步与镜像管理方面持续进化。 这一系列更新共同展现了 Rancher 技术生态的持续完善与活力,为用户在容器、虚拟化与边缘计算场景中的落地提供了更加坚实的基础。 Longhorn Longhorn 发布了 v1.9.2 与 v1.10.0 两个版本更新。本次更新聚焦于系统稳定性与性能增强,同时引入了多项新特性与兼容性优化,进一步提升了 Longhorn 在企业级云原生存储场景中的...
-
下一篇
蚂蚁百灵大模型团队正式发布并开源万亿思考模型 Ring-1T
蚂蚁百灵大模型团队正式发布了万亿思考模型Ring-1T。发布即开源,开发者可以通过Hugging Face、魔搭社区下载模型权重,也可以通过Ling Chat页面和ZenMux 进行直连模型的chat体验和API 调用。 Hugging Face:https://huggingface.co/inclusionAI/Ring-1T ModelScope:https://modelscope.cn/models/inclusionAI/Ring-1T Ling chat(国内用户):https://ling.tbox.cn/chat ZenMux(海外开发者,Chat/API ):https://zenmux.ai/inclusionai/ring-1t Ring-1T是一款基于Ling 2.0架构的万亿参数思考模型。其总参数量达到1万亿,激活参数为500亿,并支持128K上下文窗口。模型权重已同步上线Hugging Face与ModelScope,同时提供了FP8版本。 正式版在上月底发布的 preview 版本基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基...
相关文章
文章评论
共有0条评论来说两句吧...


微信收款码
支付宝收款码