英伟达最新研究：SLM（小型语言模型）才是 Agentic AI 的未来-低调大师

英伟达最新研究：SLM（小型语言模型）才是 Agentic AI 的未来

2025-08-19 154

英伟达与佐治亚理工学院研究人员联合发布《Small Language Models are the Future of Agentic AI》论文，提出了一个极具颠覆性的观点：SLM（小型语言模型）才是智能代理（Agentic AI）的未来。

https://arxiv.org/pdf/2506.02153

论文核心观点总结：

能力与需求匹配：当前主流的 AI 代理系统（如 AutoGPT、Open Interpreter 等）普遍采用 大型语言模型（LLM） 作为“大脑”，但这些代理的任务场景往往高度结构化、重复性强。
英伟达指出，7B 级别的 SLM 在代理任务上的表现已接近 70B+ 的 LLM，而资源消耗却低得多。
经济性与可持续性：使用 LLM 构建代理系统的成本是 SLM 的 10-30 倍，且能耗巨大。SLM 的轻量级特性使其更适合边缘设备、本地部署，推动 AI 从“展示品”走向“生产力工具”。
系统架构优化：论文提出一种 “混合型代理架构”，即由多个小型专用模型（SLM）分工协作，必要时再调用 LLM 处理复杂任务，避免“杀鸡用牛刀”的资源浪费。

研究人员在文中表示，与业界普遍追捧的大型语言模型（LLMs）相比，SLMs 不仅在特定任务上已具备足够的处理能力，其固有的经济性和适用性也更为出色，为构建高效、可持续的 AI Agent 奠定了基础。

而据研究团队透露，尽管 LLMs 在处理通用和复杂任务上取得了突破，但此类模型在许多 Agent 的专用场景中存在明显的资源冗余问题，未能达到理想的成本效益标准。

而通过将重心转向 SLMs，研究者发现模型在执行重复性、专业化的任务时表现却更加高效，并极大地降低了运算和部署成本。

论文作者强调，经济性是推动 AI 从展示品迈向生产力工具必不可少的因素，而 AI Agent 的规模化应用依赖于更精细的成本与效能的平衡。

此外，该论文还提到，从 LLM 到 SLM 的转变背后，是整个行业对 AI 资源有效利用的战略性思考。提出这一观点不仅是为了推动技术路线的演进，更旨在确保整个行业对 AI 发展的经济现实有更清醒的认识，帮助我们在性能和成本之间找到最佳平衡点。

微信关注我们

原文链接：https://www.oschina.net/news/367198

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

中国 GPU 厂商天数智芯拟赴港 IPO，募资或达 3-4 亿美元

据报道，上海天数智芯半导体股份有限公司正考虑在香港进行首次公开募股(IPO)，计划募资3亿至4亿美元。知情人士透露，目前相关讨论仍处于初步阶段，IPO规模及其他细节尚未敲定。天数智芯未回应置评请求。《科创板日报》报道称，有接近天数智芯的人士表示，IPO相关消息应该为真，但具体细节仍未确定。天数智芯成立于2015年，专注于开发用于运行人工智能服务的GPU产品，是力图与英伟达展开竞争并提升中国芯片能力的数家初创企业之一。天数智芯是国内第一家通用GPU公司，2020年率先实现了国产通用GPU从“0”到“1”的重大突破，2021年发布国内首款通用GPU产品天垓100，实现GPU产品量产及商用；2022年发布面向AI推理的智铠100芯片。2022年，天数智芯曾披露天垓100累计销售订单已突破5亿元。

2025-08-19

102

ElevenLabs宣布推出Eleven Music API，这是首款基于全授权数据训练、专为开发者打造的商用AI音乐生成接口。自2024年推出以来，创作者已通过该工具生成超75万首歌曲，印证市场强劲需求。使用文档：https://elevenlabs.io/docs/cookbooks/music/quickstart 据介绍，该API突破性解决了AI音乐领域的版权痛点，其模型基于百万小时授权音频数据训练，采用类GPT的Transformer架构，可通过文本提示实时生成多风格、多情绪的原创音乐，彻底规避未授权数据引发的法律风险，为游戏、广告、内容创作等行业提供合规解决方案。

2025-08-19

95

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。