苹果发布论文揭示推理大模型存在显著局限性
苹果研究团队近日发布论文,指出当前主流的推理模型(LRMs)在处理复杂问题时存在显著局限性。
https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf
研究团队通过可控的谜题环境(如汉诺塔、跳棋等)系统分析了模型的推理能力,发现其性能随问题复杂度呈现三阶段变化:
- 在低复杂度任务中,非推理模型(LLMs)表现更优;
- 中等复杂度时,推理模型通过 “思维链”(CoT)展现优势;
- 而当复杂度超过临界值(如汉诺塔圆盘数≥8),两类模型准确率均骤降至零。
研究还发现,推理模型存在 “反直觉缩放限制”:推理成本(token 使用量)随复杂度先增后减,即使在 token 预算充足的情况下,模型也会在接近崩溃点时主动减少推理投入。
对推理轨迹的分析表明,模型在简单问题中存在 “过度思考” 现象,而复杂问题中则无法有效自我修正。
此外,模型在执行明确算法时表现不佳,显示出符号操作和逻辑一致性的缺陷。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
SmolVLA:让机器人更懂 “看听说做” 的轻量化解决方案
🧭 TL;DR 今天,我们希望向大家介绍一个新的模型: SmolVLA ,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。 SmolVLA https://hf.co/lerobot/smolvla_base 仅使用开源社区共享的数据集进行预训练,数据集标签为 lerobot 。 https://hf.co/datasets?other=lerobot&sort=trending SmolVLA-450M 的表现优于许多更大的 VLA 模型,并且在仿真任务 (LIBERO,Meta-World) 和实际任务 ( SO100, SO101 ) 上超过了强基线模型,如 ACT 。 https://github.com/TheRobotStudio/SO-ARM100 https://hf.co/papers/2401.02117 支持异步推理,可提供30% 更快的响应和2 倍的任务吞吐量。 相关链接: 用于训练和评估 SO-100/101 的硬件: https://github.com/TheR...
- 下一篇
汇总 VR/AR 产业动态,持续引领科技行业潮流!
一、政策环境 【山西省首个5G+AR数字商业街区落地太原】 6月初,太原市小店区商务局举办“提振消费2025暨抱鼓巷夜经济AR景观发布仪式”。作为山西省首个5G+AR全场景数字商业街区标杆项目,通过“科技+文化+惠民”三重赋能,为太原夜经济注入强劲动力。 二、产业发展 【苹果(AAPL.US)公布“无摄像头眼动追踪系统”专利,意在打造更轻薄AR眼镜】 6月5日消息,美国专利商标局公开了一项来自苹果的专利申请,揭示了一种无需摄像头的下一代眼动追踪系统。这一技术突破对于苹果未来的AR眼镜和智能眼镜产品具有重要意义,可在不依赖摄像头的前提下实现高效精确的眼部追踪,同时大幅减小设备体积与复杂度。 【Meta(META.US)斥资数百万美元拉拢好莱坞,为下一代头显打造独家沉浸式内容】 据《华尔街日报》报道,Meta正积极游说好莱坞影视公司为其Horizon OS生态打造独家沉浸式视频内容,并已向包括迪士尼与独立电影厂牌A24在内的多家公司开出数百万美元的内容采购报价。 三、市场动态 【高通(QCOM.US)骁龙AR2芯片推动AR眼镜技术飞跃】 获悉,高通骁龙AR2芯片成为AR技术革新...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS8编译安装MySQL8.0.19
- Hadoop3单机部署,实现最简伪集群
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题