英伟达研究团队发布混合架构语言模型 Jet-Nemotron-低调大师

英伟达研究团队发布混合架构语言模型 Jet-Nemotron

2025-08-28 173

英伟达研究团队发布了Jet-Nemotron，这是一个新一代的混合架构语言模型系列。该系列通过Post Neural Architecture Search (PostNAS)流程，在冻结预训练全注意力模型MLP权重的前提下，仅对注意力模块进行高效的设计探索，实现了与领先全注意力模型相当或更高的精度，同时显著提升了生成吞-吐量。

https://arxiv.org/abs/2508.15884v1

基于该流程构建的Jet-Nemotron-2B在全面的基准测试中，精度与Qwen3、Qwen2.5、Gemma3、Llama3.2相当或更优，生成阶段吞吐速度提升最高达53.6倍，预填充阶段提速6.1倍。在MMLU与MMLU-Pro基准上，其准确度也高于近期先进的MoE全注意力模型DeepSeek-V3-Small（总参数量15B）和Moonlight（激活参数量2.2B）。

Jet-Nemotron的核心创新还包括JetBlock，这是一种动态线性注意力设计，能够智能过滤值标记，性能优于Mamba2和GLA等早期线性方法。

此外，它还采用了混合注意力策略，即在保留少量全注意力层以维护推理能力的同时，将其余部分替换为JetBlock，从而显著降低内存占用并提升吞吐量。

微信关注我们

原文链接：https://www.oschina.net/news/369039

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Litestream - SQLite 的独立流复制工具

Litestream 是 SQLite 的独立流复制工具。它作为后台进程运行，并安全地将更改增量复制到另一个文件或 S3。Litestream 仅通过 SQLite API 与 SQLite 通信，因此它不会损坏你的数据库。停止构建缓慢、复杂、脆弱的软件系统。在单个服务器上安全地运行你的应用程序。完全复制的数据库，无痛且成本低。无忧备份。将 SQLite 更改持续流式传输到 AWS S3、Azure Blob 存储、谷歌云存储、SFTP 或 NFS。如果你的服务器出现故障，请快速恢复到故障点。使用现有应用。作为一个单独的进程运行，因此你无需更改代码即可集成到现有应用程序中。非常便宜的。每天只花几毛钱。对象存储很便宜，因此无需在额外的服务器上浪费金钱。

2025-08-28

206

苹果在人工智能领域的谨慎收购策略或正拖累其发展势头。当微软、谷歌、亚马逊等竞争对手斥资数十亿美元收购AI初创企业及基础模型提供商时，苹果仍倾向于小规模战略交易，且常将内部研发置于激进并购之上。苹果管理层内部对AI战略存在明显分歧。据《The Information》报道，高级副总裁埃迪·库伊力推收购Perplexity AI（AI搜索领域）、Mistral（模型开发领域）等企业，他此前曾提议收购Netflix和特斯拉，但均遭CEO蒂姆·库克否决。而软件工程负责人克雷格·费德里吉持相反观点，认为苹果可通过内部研发弥补AI领域的差距，对大额收购持怀疑态度，更依赖内部基础模型团队，尽管该团队正面临项目延迟与人才流失问题。这一战略已带来多重风险：苹果需依赖ChatGPT等外部授权模型支撑Siri，还在测试Gemini、Claude等模型以开发未来AI功能；与谷歌搜索的长期合作正面临法律审查，收购Perplexity本可作为备选方案，但苹果的犹豫或错失机会；在苹果聚焦隐私与设备端智能时，竞争对手正快速扩大云基AI平台规模，苹果面临竞争落后风险。截至目前，苹果都尚未进行任何交易。报道也分析...

2025-08-28

186

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。