SpatialBench 榜单更新：阿里千问霸榜前二，超越 Gemini3、GPT5.1-低调大师

SpatialBench 榜单更新：阿里千问霸榜前二，超越 Gemini3、GPT5.1

2025-11-26 272

空间推理基准测试SpatialBench更新了最新一期榜单，阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名，超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。

据了解，SpatialBench是一项近年来兴起的第三方空间推理基准测试榜单，主要聚焦多模态模型在空间、结构、路径等方面的综合推理能力，被AI社区视为是衡量“具身智能”进展的新兴测试标准之一。SpatialBench不仅测试模型已知的知识，还测试模型在二维和三维空间中“感知”和操控抽象概念的能力，这对具身智能的落地尤为关键。

SpatialBench榜单显示，Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5分和12.9分，领先于Gemini 3.0 Pro Preview（9.6）、GPT-5.1（7.5）、Claude Sonnet 4.5等海外顶尖模型。然而，AI大模型的整体表现距离人类仍有差距，人类基准线80分左右，可专业处理电路分析、CAD 工程和分子生物学等复杂空间推理任务，目前大模型还无法完全自动化完成此类工作。

Qwen2.5-VL于2024年开源，Qwen3-VL是阿里在2025年开源的新一代视觉理解模型。Qwen3-VL在视觉感知和多模态推理方面实现重大突破，在32项核心能力测评中超过Gemini2.5-Pro和GPT-5，不但可以调用抠图、搜索等工具完成“带图推理”，也可以凭借一张设计草图或一段小游戏视频直接“视觉编程”。同时，Qwen3-VL专门增强了3D检测能力，可以更好地感知空间，基于Qwen3-VL，机器人更好地判断物体方位、视角变化和遮挡关系，实现远处苹果的精准抓取。

目前，Qwen3-VL已开源不同版本，包括2B、4B、8B、32B等密集模型以及30B-A3B、235B-A22B等MoE模型，每个模型都有指令版和推理版两款，是当下最受企业和开发者欢迎的开源视觉理解模型。同时，Qwen3-VL模型也已上线千问APP，用户可免费体验。

微信关注我们

原文链接：https://www.oschina.net/news/385915

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

您的战略会议室里，还缺一位“全球竞争情报官”

01.请问：谁能为您的关键决策负责？凌晨两点，CEO的办公室依然亮着灯。桌上铺满了各部门提交的月度报告：市场部的调研数据滞后了三个月，研发部的技术分析未能覆盖海外最新动向，竞品突然的降价打得所有人措手不及…… 您靠在椅背上，意识到一个问题：这一刻，究竟谁能告诉您，下一步该怎么走？是依赖那些冗长却片面的内部报告？还是凭多年经验“赌”一把？ 02.决策者的困境，源于“情报孤岛” 许多企业决策者正面临这样的矛盾：数据泛滥，但洞察稀缺：各部门数据堆积如山，却无人能够纵览全局，信心满满地告知：“新兴市场在哪里？竞品下一步要做什么？技术风口是否已经转向？” 报告滞后，却需实时决策：当您看到三个月前的市场分析时，竞争对手早已抢占了先机。责任在你，信息却在别处：团队擅长执行，但无人能整合全局情报，为您提供决策所需的“全景视角”。一位CEO曾感叹：“我需要的不是更多数据，也不是单线的情报，而是一个能洞察各方情报、并直接告诉我该怎么做的人。” 03.您需要的，是一位“全球竞争情报官” 如果存在这样一位“角色”：他能实时监控全球市场、技术、政策、竞对、投融的动向；他能从1.9亿条全球专利、8...

2025-11-27

197

在 Java 企业级应用开发中，面向切面编程（AOP）是解决横切关注点（如日志、事务、安全等）的核心技术。它允许我们将这些通用功能从业务逻辑中分离出来，实现更高的模块化和代码复用。然而，不同的生态提供了不同的AOP实现。本文将深入比较三位“主角”：老牌王者 AspectJ、生态霸主 Spring AOP与后起之秀 Solon AOP。一、特性对比特性 AspectJ Spring AOP Solon AOP 实现机制字节码织入（Bytecode Weaving）：通过修改目标类的字节码来实现 AOP。动态代理（Dynamic Proxy）：运行时为目标对象生成代理对象。动态代理（Dynamic Proxy）：运行时为目标对象生成代理对象。织入方式编译时织入 (CTW)、加载时织入 (LTW)、运行时织入 (RTW)。运行时织入（Proxy Generation）。运行时织入（Proxy Generation）。功能范围全功能 AOP。可以拦截几乎所有连接点。简化的 AOP，主要用于解决企业级应用中的常见横切关注点。更简化的 AOP，只专注基于“注解”的拦截。...

2025-11-26

192

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。