微软开源“原生 1-bit”模型：超过 20 亿参数、大幅减少内存占用-低调大师

微软开源“原生 1-bit”模型：超过 20 亿参数、大幅减少内存占用

2025-04-22 306

微软近日发布了20亿参数的1-bit模型——BitNet b1.58 LLM家族，称此新型模型比主流Transformer LLM更不占内存且更低能耗，适合在CPU或较小型硬件平台上执行。

Hugging Face 地址：https://huggingface.co/microsoft/bitnet-b1.58-2B-4T

微软研究院与中国科学院研究人员2023年发布名为《BitNet: Scaling 1-bit Transformers for Large Language Models》的论文，首度发布为大语言模型设计的1-bit Transformer架构，称为BitNet。

https://arxiv.org/pdf/2310.11453

微软表示，这是第一个参数20亿的开源原生1-bit LLM。它是以4兆字词的数据集训练而成，具备4096 token的context length。

研究团队说明，在BitNet b1.58模型中，单一参数或权重是三元（ {-1, 0, 1}）的。此类新模型架构引入BitLinear作为nn.Linear层的替代，能够训练1-bit的权重，训练出的LLM和同样参数量及训练字词的全精度（FP16）Transformer LLM模型相较，具有相同的困惑度（perplexity）及终端任务性能，但却能大幅减少了内存占用和能源耗损，就延迟性及传输率表现而言也更省成本。

微软团队认为，最重要的是， BitNet b1.58提出了新的模型扩展法则，可用于训练高性能及低成本的下时代LLM，而且BitNet b1.58对CPU设备更为友善，更适合执行于边缘和移动设备上，显示出性能和能力。研究人员相信1-bit LLM可催生出新的硬件和为其优化的系统。

根据研究团队比较测试，BitNet b1.58-3B/3.9B版本占用内存为2.22GB及2.38GB，远小于LLaMA-3B的7.89GB。延迟性来看，BitNet b1.58-3B/3.9B各为1.87ms及2.11ms，优于LLaMA-3B的5.07ms。二个BitNet b1.58的PPL以及零样本训练准确性表现，也都超越LLaMA-3B。

微软已在Hugging Face开源三个版本的Bitnet-b1.58模型权重，一是BitNet b1.58 2B4T，适合模型部署。二是Bitnet-b1.58-2B-4T-bf16，仅适合模型训练或微调。BitNet-b1.58-2B-4T-gguf则包含GGUF格式的权重，兼容bitnet.cpp函数库用于CPU推论。

论文地址：https://arxiv.org/abs/2504.12285

但微软也警告开发人员，目前Transformers函数库的执行方式并没有包含为BitNet设计、高度优化的计算核心，因此无法彰显BitNet架构的好处。

所以，虽然开发人员可能会因这个模型使用了量化（quantized）的权重而看到节省了一点内存，但无法看出速度快、能耗低等性能优势，因为transformers本身不支持BitNet所需要的底层运算加速。想要体验论文中提到的性能（包括低功耗和高效率的推论），必须使用官方提供的C++ 实例版本：bitnet.cpp。

微信关注我们

原文链接：https://www.oschina.net/news/345921/microsoft-bitnet

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenAI 发布 Agent 开发指南

OpenAI官方发布了首个Agent开发指南，帮助开发者如何通过其SDK快速开发智能体。 https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf 在这份指南中，OpenAI详细介绍了从智能体的大模型选择，工具定义，复杂智能体，安全护栏等所有开发流程，并附加了大量实际开发案例。即便你不使用OpenAI开源的AgentSDK来开发智能体，也可以作为开发参考样本，它提供了清晰的开发框架和思路，无论是资深开发者还是刚入门的新人都能获得很好的启发。

2025-04-22

191

国家网络与信息安全信息通报中心近日通报了 67 款违法违规收集使用个人信息情况移动应用。具体如下： 1、在App首次运行时未通过弹窗等明显方式提示用户阅读隐私政策等收集使用规则；以默认选择同意隐私政策等非明示方式征求用户同意；个人信息处理者在处理个人信息前，未以显著方式、清晰易懂的语言真实、准确、完整地向个人告知个人信息处理者的名称或者姓名、联系方式、个人信息的保存期限等。涉及11款移动应用如下：《客很多》（版本2.8.9，百度手机助手）、《城泊通》（版本3.2.1，360手机助手）、《e万源》（版本3.5.1，应用宝）、《赢海云管船》（版本2.12.6，应用宝）、《口袋家教学生》（版本3.3.32，应用宝）、《约驾校》（版本2.1.88，应用宝）、《物流头条》（版本1.7.5，360手机助手）、《V同城》（版本2.0.6，应用宝）、《昕宝泊车》（版本1.0.8，腾牛网）、《实景罗盘指南针》（版本5.0.3，应用宝）、《高人汇》（版本7.47，360手机助手）。 2、隐私政策未逐一列出App（包括委托的第三方或嵌入的第三方代码、插件）收集使用个人信息的目的、方式、范围等。...

2025-04-22

288

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。