苹果发布论文揭示推理大模型存在显著局限性-低调大师

苹果发布论文揭示推理大模型存在显著局限性

2025-06-09 164

苹果研究团队近日发布论文，指出当前主流的推理模型（LRMs）在处理复杂问题时存在显著局限性。

https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf

研究团队通过可控的谜题环境（如汉诺塔、跳棋等）系统分析了模型的推理能力，发现其性能随问题复杂度呈现三阶段变化：

在低复杂度任务中，非推理模型（LLMs）表现更优；
中等复杂度时，推理模型通过 “思维链”（CoT）展现优势；
而当复杂度超过临界值（如汉诺塔圆盘数≥8），两类模型准确率均骤降至零。

研究还发现，推理模型存在 “反直觉缩放限制”：推理成本（token 使用量）随复杂度先增后减，即使在 token 预算充足的情况下，模型也会在接近崩溃点时主动减少推理投入。

对推理轨迹的分析表明，模型在简单问题中存在 “过度思考” 现象，而复杂问题中则无法有效自我修正。

此外，模型在执行明确算法时表现不佳，显示出符号操作和逻辑一致性的缺陷。

微信关注我们

原文链接：https://www.oschina.net/news/354349

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

SmolVLA：让机器人更懂 “看听说做” 的轻量化解决方案

🧭 TL;DR 今天，我们希望向大家介绍一个新的模型: SmolVLA ，这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型，专为机器人领域设计，并且可以在消费级硬件上运行。 SmolVLA https://hf.co/lerobot/smolvla_base 仅使用开源社区共享的数据集进行预训练，数据集标签为 lerobot 。 https://hf.co/datasets?other=lerobot&sort=trending SmolVLA-450M 的表现优于许多更大的 VLA 模型，并且在仿真任务 (LIBERO，Meta-World) 和实际任务 ( SO100, SO101 ) 上超过了强基线模型，如 ACT 。 https://github.com/TheRobotStudio/SO-ARM100 https://hf.co/papers/2401.02117 支持异步推理，可提供30% 更快的响应和2 倍的任务吞吐量。相关链接: 用于训练和评估 SO-100/101 的硬件: https://github.com/TheR...

2025-06-09

287

一、政策环境【山西省首个5G+AR数字商业街区落地太原】 6月初，太原市小店区商务局举办“提振消费2025暨抱鼓巷夜经济AR景观发布仪式”。作为山西省首个5G+AR全场景数字商业街区标杆项目，通过“科技+文化+惠民”三重赋能，为太原夜经济注入强劲动力。二、产业发展【苹果（AAPL.US）公布“无摄像头眼动追踪系统”专利，意在打造更轻薄AR眼镜】 6月5日消息，美国专利商标局公开了一项来自苹果的专利申请，揭示了一种无需摄像头的下一代眼动追踪系统。这一技术突破对于苹果未来的AR眼镜和智能眼镜产品具有重要意义，可在不依赖摄像头的前提下实现高效精确的眼部追踪，同时大幅减小设备体积与复杂度。【Meta（META.US）斥资数百万美元拉拢好莱坞，为下一代头显打造独家沉浸式内容】据《华尔街日报》报道，Meta正积极游说好莱坞影视公司为其Horizon OS生态打造独家沉浸式视频内容，并已向包括迪士尼与独立电影厂牌A24在内的多家公司开出数百万美元的内容采购报价。三、市场动态【高通（QCOM.US）骁龙AR2芯片推动AR眼镜技术飞跃】获悉，高通骁龙AR2芯片成为AR技术革新...

2025-06-09

171

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。