您现在的位置是:首页 > 文章详情

通义千问 Qwen3-VL 上新:4B & 8B 稠密模型

日期:2025-10-15点击:11

阿里通义 Qwen 团队正式发布 Qwen3-VL 系列的全新成员 —— 4B 与 8B 模型。Qwen3-VL 系列模型于上月发布,是迄今为止 Qwen 系列中最强大的视觉语言模型。

本次发布包含了 4B 和 8B 两种参数规模,两个尺寸均提供 Instruct 与 Thinking 版本。

新模型实现了以下关键目标:

  • 更低的资源门槛:尺寸缩减显著降低 VRAM 的占用。现在,开发者可以在更广泛的硬件设备上部署和运行模型。
  • 在缩减尺寸的同时,完整保留了 Qwen3-VL 的全部核心功能。
  • 卓越的基准性能: 在 STEM、VQA、OCR、视频理解及 Agent 任务等多个权威基准上,其表现不仅超越了 Gemini 2.5 Flash Lite 和 GPT-5 Nano,在许多场景下甚至能与半年前的旗舰模型 Qwen2.5-VL-72B 相媲美。

模型地址:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

原文链接:https://www.oschina.net/news/377479
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章