OpenBMB 发布端侧多模态模型 MiniCPM-V 4.0
OpenBMB 发布了 MiniCPM-V 系列的最新高效模型 MiniCPM-V 4.0。该模型基于 SigLIP2-400M 和 MiniCPM4-3B 构建,总参数量为 4.1B,专为设备端部署而设计。
MiniCPM-V 4.0 不仅继承了 MiniCPM-V 2.6 在单图、多图和视频理解方面的强大能力,还大幅提升了运行效率。
MiniCPM-V 4.0 的主要亮点包括:
- 领先的视觉能力
仅凭 41 亿参数,MiniCPM-V 4.0 在 OpenCompass(涵盖 8 个主流视觉基准的综合评测)中取得了 69.0 的平均得分,超越 GPT-4.1-mini-20250414、MiniCPM-V 2.6(65.2,参数量 81 亿)和 Qwen2.5-VL-3B-Instruct(64.5,参数量 38 亿)。
此外,它在多图理解与视频理解任务中也表现出色。
- 卓越的运行效率
MiniCPM-V 4.0 专为端侧部署设计,可在移动设备上流畅运行。例如,在 iPhone 16 Pro Max 上,其首 token 延迟 小于 2 秒,解码速度 超过 17 token/s,并且无明显发热问题。在并发请求场景下也展现出优秀的吞吐能力。
- 简单易用
MiniCPM-V 4.0 支持多种主流部署方式,包括:llama.cpp、Ollama、vLLM、SGLang、LLaMA-Factory 以及本地 Web Demo 等。
模型地址:https://huggingface.co/openbmb/MiniCPM-V-4

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
播放器音频后处理实践
一. 前言 丨1. 行业背景 在现代播放器架构中,音频后处理已不仅是锦上添花的功能,而是构建差异化听觉体验的关键组件。尤其在多样化的播放场景(手机外放、耳机、电视音响等)下,通过定制化的音效增强手段,有效提升听感表现已成为基础能力之一。 丨2. 本文概览 本系列文章将系统介绍我们在播放器音频后处理模块中的技术方案与工程实现,主要面向音视频方向的开发者。我们主要基于 FFmpeg的音频滤镜框架,结合自定义模块,构建了一套可扩展、高性能、易适配的音效处理链路。 第一期内容聚焦在两项核心基础音效: 重低音:通过构建低通滤波器与动态增益控制逻辑,增强低频段表现,适配小型设备下的听感优化 清晰人声:结合频段增强、人声掩码与背景音抑制技术,有效提升对白清晰度,在嘈杂或背景音复杂的场景下保持语音主干突出 我们将分享上述音效的整体处理流程、关键滤镜链搭建方式、滤波器设计细节,以及如何在保证延迟与功耗可控的前提下,通过 FFmpeg 的 af(audio filter)机制灵活插拔各类处理节点。 希望本系列文章能为你提供实用的技术参考,也欢迎有 FFmpeg 或音效处理相关实践经验的开发者交流碰撞,共同...
- 下一篇
英伟达深夜发声:NVIDIA 芯片不存在后门、终止开关、监控软件
日前,英伟达H20芯片存在后门风险一事引发热议。 今天凌晨,英伟达官方发文再次回应,称“英伟达芯片不存在后门、终止开关和监控软件”。英伟达提到,为了降低误用风险,一些专家和政策制定者提出需要在硬件中设置“终止开关”或内置控件,以便在用户不知情和未经同意的情况下远程禁用GPU。有人怀疑这种情况已经存在,但英伟达GPU不存在也不应该设置终止开关和后门。 https://weibo.com/ttarticle/p/show?id=2309405196448018071609 英伟达表示,有人将智能手机的“查找我的手机”或“远程擦除”等功能视为GPU终止开关的模型。 这种类比站不住脚,因为软件功能完全由用户选择和控制,它们不是硬件后门。 英伟达始终支持开放、透明的软件,在用户知晓并征得其同意的情况下,帮助客户充分利用其GPU驱动的系统(包括诊断、性能监测、错误报告和及时修补) 。 在芯片中硬植“终止开关“则完全不同:这是用户无法控制的永久性缺陷,有可能造成严重后果。 英伟达举例:这就像买一辆汽车时,经销商设置远程制动,以控制您的开车行为。 这不是合理的政策,而是一种过度的反应,将对美国和全球经...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- Docker使用Oracle官方镜像安装(12C,18C,19C)