Qwen3-VL-Embedding & Reranker 开源，专为多模态信息检索与跨模态理解设计-低调大师

Qwen3-VL-Embedding & Reranker 开源，专为多模态信息检索与跨模态理解设计

2026-01-09 50

阿里通义大模型团队正式开源发布 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 模型系列，这两个模型基于 Qwen3-VL 构建，专为多模态信息检索与跨模态理解设计，为图文、视频等混合内容的理解与检索提供统一、高效的解决方案。

多模态通用性

两个模型系列均能在统一框架内处理文本、图像、可视化文档（图表、代码、UI组件......）、视频等多种模态输入。在图文检索、视频-文本匹配、视觉问答（VQA），多模态内容聚类等多样化任务中，均达到了业界领先水平。

统一表示学习（Embedding）

Qwen3-VL-Embedding 充分利用 Qwen3-VL 基础模型的优势，能够生成语义丰富的向量表示，将视觉与文本信息映射到同一语义空间中，从而实现高效的跨模态相似度计算与检索。

图1：统一多模态表示空间示意图。Qwen3-VL-Embedding模型系列将多源数据（文本、图像、视觉文档和视频）映射到共同的高维语义空间。

高精度重排序（Reranker）

作为 Embedding 模型的补充，Qwen3-VL-Reranker 接收任意模态组合的查询与文档对（eg：图文查询匹配图文文档），输出精确的相关性分数。在实际应用中，二者常协同工作：Embedding 负责快速召回，Reranker 负责精细化重排序，构成“两阶段检索流程”，显著提升最终结果精度。

卓越的实用性

该系列继承了 Qwen3-VL 的多语言能力，支持超过 30 种语言，适合全球化部署。模型提供灵活的向量维度选择、任务指令定制，以及量化后仍保持的优秀性能，便于开发者集成到现有系统中。

Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 采用了不同的架构设计，分别针对检索流程的不同阶段进行优化。

图 2：Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 架构概览。左侧为 Embedding 模型的双塔独立编码架构，右侧为 Reranker 模型的单塔交叉注意力架构。

Qwen3-VL-Embedding 采用双塔架构，可以高效地将不同模态的内容独立编码为统一的向量表示，特别适合处理海量数据的并行计算。

Embedding 模型接收单模态或混合模态输入，并将其映射为高维语义向量。我们提取基座模型最后一层中对应 [EOS] token 的隐藏状态向量，作为输入的最终语义表示。这种方法确保了大规模检索所需的高效独立编码能力。

Qwen3-VL-Reranker 采用单塔架构，通过内部的交叉注意力机制，深度分析查询与文档之间的语义关联，从而输出精确的相关性分数。

在实际工作中，Reranking 模型接收输入对 (Query, Document) 并进行联合编码。它利用基座模型内的交叉注意力机制，实现 Query 和 Document 之间更深层、更细粒度的跨模态交互和信息融合。模型最终通过预测两个特殊 token（yes 和 no）的生成概率来表达输入对的相关性分数。

GitHub 仓库：

https://github.com/QwenLM/Qwen3-VL-Embedding

魔搭 ModelScope：

https://modelscope.cn/collections/Qwen/Qwen3-VL-Embedding
https://modelscope.cn/collections/Qwen/Qwen3-VL-Reranker

微信关注我们

原文链接：https://www.oschina.net/news/395184

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

微软报告：DeepSeek 凭高性价比成黑马，在部分海外市场份额超 50%

微软最新发布的一项研究报告显示，国产 AI 初创企业DeepSeek正凭借其极高的性价比，在广大发展中国家（即“全球南方”）展现出极强的统治力。报告指出，截至去年12月的三个月内，全球生成式 AI 的用户渗透率已升至16.3%。然而，由于基础设施和投入的差异，发达国家与发展中国家之间的差距正持续扩大。在这种背景下，DeepSeek凭借“开源”与“免费”两大杀手锏，在西方平台服务覆盖不足的市场迅速打开了局面。研究发现，DeepSeek在中国市场的占有率高达89%，而在白俄罗斯、古巴和俄罗斯等地的市场份额也分别达到了56%、49% 和43%。此外，在叙利亚、伊朗以及埃塞俄比亚等非洲国家，该模型的普及速度同样惊人。值得注意的是，DeepSeek往往作为华为等中国品牌手机的预装助手，直接触达了数以千万计的海外用户。微软研究人员坦言，DeepSeek在数学运算和代码编写等任务上表现优异，是一款“优质模型”。尽管北美和欧洲市场受政策和安全审查影响，其渗透率相对较低，但DeepSeek的崛起已向世界证明:AI 的普及程度不仅取决于性能，更取决于技术的可获取性与普及性。

2026-01-09

42

摩尔线程正式发布开源大模型分布式训练仿真工具SimuMax的1.1版本。该版本在完整继承v1.0高精度仿真能力的基础上，实现了从单一工具到一体化全栈工作流平台的重要升级，为大模型训练的仿真与调优提供系统化支持。本次更新聚焦三大核心创新：用户友好的可视化配置界面、智能并行策略搜索，以及融合计算与通信效率建模的System-Config生成流水线。新版本同时提升了对主流训练框架Megatron-LM的兼容性，并增强了对混合并行训练中复杂通信行为的建模精度，使仿真环境更贴近真实生产场景。 SimuMax是一款专为大语言模型（LLM）分布式训练负载设计的仿真模拟工具，可为单卡到万卡集群提供仿真支持。它无需实际执行完整训练过程，即可高精度模拟训练中的显存使用和性能表现，帮助用户深入洞察训练效率，探索提升计算效能的优化途径。根据介绍，SimuMax v1.1在高精度仿真能力的基础上，通过以下多项功能构建了更完整、更智能的工作流：智能并行策略搜索：引入策略搜索支持，自动探索并识别更优的并行化及执行策略，降低调参成本，提升训练效率；系统配置生成流水线：新增系统配置文件生成流水线，包含计算效率与...

2026-01-09

44

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。