通义千问 Qwen3-VL 上新:4B & 8B 稠密模型
阿里通义 Qwen 团队正式发布 Qwen3-VL 系列的全新成员 —— 4B 与 8B 模型。Qwen3-VL 系列模型于上月发布,是迄今为止 Qwen 系列中最强大的视觉语言模型。
本次发布包含了 4B 和 8B 两种参数规模,两个尺寸均提供 Instruct 与 Thinking 版本。
新模型实现了以下关键目标:
- 更低的资源门槛:尺寸缩减显著降低 VRAM 的占用。现在,开发者可以在更广泛的硬件设备上部署和运行模型。
- 在缩减尺寸的同时,完整保留了 Qwen3-VL 的全部核心功能。
- 卓越的基准性能: 在 STEM、VQA、OCR、视频理解及 Agent 任务等多个权威基准上,其表现不仅超越了 Gemini 2.5 Flash Lite 和 GPT-5 Nano,在许多场景下甚至能与半年前的旗舰模型 Qwen2.5-VL-72B 相媲美。
模型地址:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe


