英伟达研究团队发布混合架构语言模型 Jet-Nemotron
英伟达研究团队发布了Jet-Nemotron,这是一个新一代的混合架构语言模型系列。该系列通过Post Neural Architecture Search (PostNAS)流程,在冻结预训练全注意力模型MLP权重的前提下,仅对注意力模块进行高效的设计探索,实现了与领先全注意力模型相当或更高的精度,同时显著提升了生成吞-吐量。
https://arxiv.org/abs/2508.15884v1
基于该流程构建的Jet-Nemotron-2B在全面的基准测试中,精度与Qwen3、Qwen2.5、Gemma3、Llama3.2相当或更优,生成阶段吞吐速度提升最高达53.6倍,预填充阶段提速6.1倍。在MMLU与MMLU-Pro基准上,其准确度也高于近期先进的MoE全注意力模型DeepSeek-V3-Small(总参数量15B)和Moonlight(激活参数量2.2B)。
Jet-Nemotron的核心创新还包括JetBlock,这是一种动态线性注意力设计,能够智能过滤值标记,性能优于Mamba2和GLA等早期线性方法。
此外,它还采用了混合注意力策略,即在保留少量全注意力层以维护推理能力的同时,将其余部分替换为JetBlock,从而显著降低内存占用并提升吞吐量。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Litestream - SQLite 的独立流复制工具
Litestream 是 SQLite 的独立流复制工具。它作为后台进程运行,并安全地将更改增量复制到另一个文件或 S3。Litestream 仅通过 SQLite API 与 SQLite 通信,因此它不会损坏你的数据库。 停止构建缓慢、复杂、脆弱的软件系统。在单个服务器上安全地运行你的应用程序。完全复制的数据库,无痛且成本低。 无忧备份。将 SQLite 更改持续流式传输到 AWS S3、Azure Blob 存储、谷歌云存储、SFTP 或 NFS。如果你的服务器出现故障,请快速恢复到故障点。 使用现有应用。作为一个单独的进程运行,因此你无需更改代码即可集成到现有应用程序中。 非常便宜的。每天只花几毛钱。对象存储很便宜,因此无需在额外的服务器上浪费金钱。
-
下一篇
苹果对大型交易的抵触或阻碍其自身 AI 发展
苹果在人工智能领域的谨慎收购策略或正拖累其发展势头。当微软、谷歌、亚马逊等竞争对手斥资数十亿美元收购AI初创企业及基础模型提供商时,苹果仍倾向于小规模战略交易,且常将内部研发置于激进并购之上。 苹果管理层内部对AI战略存在明显分歧。据《The Information》报道,高级副总裁埃迪·库伊力推收购Perplexity AI(AI搜索领域)、Mistral(模型开发领域)等企业,他此前曾提议收购Netflix和特斯拉,但均遭CEO蒂姆·库克否决。 而软件工程负责人克雷格·费德里吉持相反观点,认为苹果可通过内部研发弥补AI领域的差距,对大额收购持怀疑态度,更依赖内部基础模型团队,尽管该团队正面临项目延迟与人才流失问题。 这一战略已带来多重风险:苹果需依赖ChatGPT等外部授权模型支撑Siri,还在测试Gemini、Claude等模型以开发未来AI功能;与谷歌搜索的长期合作正面临法律审查,收购Perplexity本可作为备选方案,但苹果的犹豫或错失机会;在苹果聚焦隐私与设备端智能时,竞争对手正快速扩大云基AI平台规模,苹果面临竞争落后风险。 截至目前,苹果都尚未进行任何交易。报道也分析...
相关文章
文章评论
共有0条评论来说两句吧...