面壁小钢炮 MiniCPM-V 4.5 开源:8B 性能超越 72B
面壁智能宣布正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型。 “行业首个具备高刷视频理解能力的多模态模型,看得准、看得快,看得长。高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。” MiniCPM-V 4.5 亮点一览 首个「高刷视频理解」多模态模型,兼顾性能与效率:高刷视频理解同级 SOTA 且超过 Qwen2.5-VL 72B 越级领先;同等视觉 token 开销下, MiniCPM-V 4.5 可接收 6 倍视频帧数量,达到 96 倍视觉压缩率,是同类模型的 12-24 倍; 最强多模态 SOTA 模型:图片理解、长视频理解、OCR、文档解析同级 SOTA,且超过 Qwen2.5-VL 72B 达到 越级领先; 端侧友好:提供 SOTA 级多模态表现的同时,带来最佳的推理效率,显存占用、平均推理时间等领先优势显著; 支持长思考、短思考可控混合推理,性能好、速度快。 根据介绍,MiniCPM-V 4.5 通过将模型结构从 2D-Resampler 拓展为 3D-Resamp...


