您现在的位置是:首页 > 文章详情

OpenBMB 发布并开源 MiniCPM 4.1-8B

日期:2025-09-08点击:16

OpenBMB 正式推出并开源 MiniCPM4.1-8B,这是首个开源的混合推理大语言模型,该模型通过系统性创新实现了端侧极致效率,支持深度推理模式与非推理模式一键切换。

该系列在 8B 参数规模下通过模型架构、训练数据、训练算法和推理系统四个维度的系统性创新,实现端侧极致效率。

模型亮点

  • 首个原生稀疏架构的深思考模型,通过可训练稀疏注意力创新,代码、数学推理等任务的推理速度比同尺寸开源模型快 3 倍以上
  • 知识、推理、编程、指令遵循等 15 个评测基准,取得综合平均分同尺寸模型第一
  • 支持高效双频换挡:长文本用稀疏,短文本用稠密
  • 端侧友好,在 128K 长文本场景下,MiniCPM 4.1 相较于 Qwen3-8B 仅需 25% 的缓存存储空间

MiniCPM4.1-8B 采用 InfLLM v2 可训练稀疏注意力机制,在 128K 长文本场景下每个 token 仅与不到 5% 的 token 计算相关性,显著降低长文本计算开销;原生支持 65,536 token 上下文,通过 LongRoPE 可扩展至 131,072 token。

目前,模型已在 Github、Hugging Face、魔搭社区开源

🔗Github:https://github.com/OpenBMB/MiniCPM
🔗Hugging Face: https://huggingface.co/openbmb/MiniCPM4.1-8B
🔗ModelScope:https://modelscope.cn/models/OpenBMB/MiniCPM4.1-8B

原文链接:https://www.oschina.net/news/370929
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章