您现在的位置是：首页 > 文章详情

面壁智能开源端侧多模态大模型：MiniCPM-Llama3-V 2.5

日期：2024-05-21点击：251收藏

面壁智能开源了端侧多模态模型 MiniCPM-Llama3-V 2.5，且支持 30+ 多种语言。

MiniCPM-Llama3-V 2.5 是 MiniCPM-V系列的最新、性能最佳模型。总参数量8B，多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型，OCR 能力及指令跟随能力进一步提升——精准识别难图长图长文本，并支持超过30种语言的多模态交互。

通过系统使用模型量化、CPU、NPU、编译优化等高效推理技术，MiniCPM-Llama3-V 2.5 可以实现高效的终端设备部署。

官方称 MiniCPM-Llama3-V 2.5 实现了「以最小参数，撬动最强性能」的最佳平衡点。