OpenBMB 发布 MiniCPM4 系列模型,专为端侧设备优化
OpenBMB 发布了 MiniCPM4 系列高效大语言模型,该系列专为端侧设备设计,通过在模型架构、训练数据、训练算法和推理系统四个维度的系统性创新,实现了效率的提升。
MiniCPM4 系列包括多个模型,具体如下:
模型名称 | 主要特点/用途 |
---|---|
MiniCPM4-8B | 旗舰模型, |
MiniCPM4-0.5B | 小型版, |
MiniCPM4-8B-Eagle-FRSpec | MiniCPM4-8B 推理加速 Eagle head 模型 |
MiniCPM4-8B-Eagle-FRSpec-QAT-cpmcu | MiniCPM4-8B 推理加速 Eagle head 模型 (QAT) |
MiniCPM4-8B-Eagle-vLLM | MiniCPM4-8B 推理加速 Eagle head 模型 (vLLM) |
MiniCPM4-8B-marlin-Eagle-vLLM | MiniCPM4-8B 推理加速 Eagle head 模型 (marlin, vLLM) |
BitCPM4-0.5B | 极端三元量化模型,参数压缩至三元值,实现90%位宽缩减 |
BitCPM4-1B | 极端三元量化模型 |
MiniCPM4-Survey | 基于 |
MiniCPM4-MCP | 基于 |
该系列模型的关键技术特性包括:
- 采用可训练稀疏注意力机制 InfLLM v2,在处理 128K 长文本时每个token仅需与少于 5% 的token计算相关性;
- 通过 模型风洞2.0 实现高效可预测扩展;
- 使用 BitCPM 进行极端三元量化;
- 采用 FP8低精度计算 和多token预测训练策略。
- 数据方面,通过 UltraClean流程 过滤和生成高质量预训练数据(开源了 UltraFinweb数据集),并使用 UltraChat v2 生成高质量监督微调数据。
- 推理系统方面,推出了集成稀疏注意力、模型量化和推测采样技术的CUDA推理框架 CPM.cu,以及支持跨平台部署的 ArkInfer系统。
MiniCPM4 原生支持高达 32768 token的上下文长度,并可通过 LongRoPE技术 扩展至 131072 token。在 Jetson AGX Orin 和 RTX 4090 等端侧芯片上,MiniCPM4 在长文本处理任务中展现出比同规模模型更快的处理速度,例如在 Jetson AGX Orin 上,其解码速度相较 Qwen3-8B 提升约 7倍。
用户可以通过 CPM.cu、Hugging Face Transformers、SGLang 或 vLLM 进行模型推理:https://huggingface.co/openbmb/MiniCPM4-8B

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
小红书发布首个开源大模型 dots.llm1
小红书hi lab(Humane Intelligence Lab,人文智能实验室)团队宣布首次开源文本大模型 dots.llm1,一个中等规模的Mixture of Experts (MoE)文本大模型。hi lab团队开源了所有模型和必要的训练信息,包括Instruct模型、长文base模型、退火阶段前后的多个base模型及超参数等内容。 dots.llm1的基本情况: 模型参数:总参数量142B、激活参数14B MoE配置:6in128 Expert、2个共享Expert 预训练数据:11.2T token高质量数据,显著优于开源数据 训练效率:基于Interleaved 1F1B 流水并行的AlltoAll overlap和高效Grouped GEMM的MoE训练框架 在预训练阶段,dots.llm1一共使用了11.2T 高质量token,然后经过两阶段sft训练,得到dots.llm1 base模型和instruct模型,在综合指标上打平Qwen2.5 72B模型,具体指标对照情况如下: 关于dots.llm1开源,hi lab团队声称其做到了迄今为止行业最大力度: 开源do...
- 下一篇
JakartaOne Livestream 演讲嘉宾招募
JakartaOne Livestream是Jakarta EE工作组面向开发人员、技术爱好者的线上会议,旨在促进技术交流和知识分享,探讨Jakarta EE相关技术发展现状及未来趋势。JakartaEE中国社区计划于2025年9月25日举行JakartOne Livestream中文线上会议,现进行讲师招募,欢迎扫码联络。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7设置SWAP分区,小内存服务器的救世主
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果