OpenBMB 发布端侧多模态模型 MiniCPM-V 4.0-低调大师

OpenBMB 发布端侧多模态模型 MiniCPM-V 4.0

2025-08-06 205

OpenBMB 发布了 MiniCPM-V 系列的最新高效模型 MiniCPM-V 4.0。该模型基于 SigLIP2-400M 和 MiniCPM4-3B 构建，总参数量为 4.1B，专为设备端部署而设计。

MiniCPM-V 4.0 不仅继承了 MiniCPM-V 2.6 在单图、多图和视频理解方面的强大能力，还大幅提升了运行效率。

MiniCPM-V 4.0 的主要亮点包括：

领先的视觉能力

仅凭 41 亿参数，MiniCPM-V 4.0 在 OpenCompass（涵盖 8 个主流视觉基准的综合评测）中取得了 69.0 的平均得分，超越 GPT-4.1-mini-20250414、MiniCPM-V 2.6（65.2，参数量 81 亿）和 Qwen2.5-VL-3B-Instruct（64.5，参数量 38 亿）。
此外，它在多图理解与视频理解任务中也表现出色。

卓越的运行效率

MiniCPM-V 4.0 专为端侧部署设计，可在移动设备上流畅运行。例如，在 iPhone 16 Pro Max 上，其首 token 延迟小于 2 秒，解码速度超过 17 token/s，并且无明显发热问题。在并发请求场景下也展现出优秀的吞吐能力。

简单易用

MiniCPM-V 4.0 支持多种主流部署方式，包括：llama.cpp、Ollama、vLLM、SGLang、LLaMA-Factory 以及本地 Web Demo 等。

模型地址：https://huggingface.co/openbmb/MiniCPM-V-4

微信关注我们

原文链接：https://www.oschina.net/news/364538

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

播放器音频后处理实践

一. 前言丨1. 行业背景在现代播放器架构中，音频后处理已不仅是锦上添花的功能，而是构建差异化听觉体验的关键组件。尤其在多样化的播放场景（手机外放、耳机、电视音响等）下，通过定制化的音效增强手段，有效提升听感表现已成为基础能力之一。丨2. 本文概览本系列文章将系统介绍我们在播放器音频后处理模块中的技术方案与工程实现，主要面向音视频方向的开发者。我们主要基于 FFmpeg的音频滤镜框架，结合自定义模块，构建了一套可扩展、高性能、易适配的音效处理链路。第一期内容聚焦在两项核心基础音效：重低音：通过构建低通滤波器与动态增益控制逻辑，增强低频段表现，适配小型设备下的听感优化清晰人声：结合频段增强、人声掩码与背景音抑制技术，有效提升对白清晰度，在嘈杂或背景音复杂的场景下保持语音主干突出我们将分享上述音效的整体处理流程、关键滤镜链搭建方式、滤波器设计细节，以及如何在保证延迟与功耗可控的前提下，通过 FFmpeg 的 af（audio filter）机制灵活插拔各类处理节点。希望本系列文章能为你提供实用的技术参考，也欢迎有 FFmpeg 或音效处理相关实践经验的开发者交流碰撞，共同...

2025-08-06

175

日前，英伟达H20芯片存在后门风险一事引发热议。今天凌晨，英伟达官方发文再次回应，称“英伟达芯片不存在后门、终止开关和监控软件”。英伟达提到，为了降低误用风险，一些专家和政策制定者提出需要在硬件中设置“终止开关”或内置控件，以便在用户不知情和未经同意的情况下远程禁用GPU。有人怀疑这种情况已经存在，但英伟达GPU不存在也不应该设置终止开关和后门。 https://weibo.com/ttarticle/p/show?id=2309405196448018071609 英伟达表示，有人将智能手机的“查找我的手机”或“远程擦除”等功能视为GPU终止开关的模型。这种类比站不住脚，因为软件功能完全由用户选择和控制，它们不是硬件后门。英伟达始终支持开放、透明的软件，在用户知晓并征得其同意的情况下，帮助客户充分利用其GPU驱动的系统（包括诊断、性能监测、错误报告和及时修补）。在芯片中硬植“终止开关“则完全不同：这是用户无法控制的永久性缺陷，有可能造成严重后果。英伟达举例：这就像买一辆汽车时，经销商设置远程制动，以控制您的开车行为。这不是合理的政策，而是一种过度的反应，将对美国和全球经...

2025-08-06

218

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。