大模型 AI 扫地机器人 “翻车”：成功率仅 40%-低调大师

大模型 AI 扫地机器人 “翻车”：成功率仅 40%

2025-11-03 204

AI 实验室 Andon Labs 进行了一项引人注目的研究，专门评估了搭载顶级大模型的扫地机器人在完成简单家务任务时的表现。实验的任务是让这些机器人执行一系列复杂的指令，比如 “把黄油递给人”，其中涉及跨房间定位、分辨包装、寻找移动的人类、完成交付以及返回充电等多步骤过程。

然而结果表明，这些先进的机器人在执行任务时的成功率远远低于人类，具体数据显示，Gemini2.5Pro 的成功率仅为40%，Claude Opus4.1为37%，而 GPT-5更是低至30%。这些数字表明，尽管它们具备强大的文本生成能力，但在实际的空间推理、环境理解和长期任务规划等领域仍显得力不从心。

研究团队指出，这种低成功率不仅在于技术的不足，还存在潜在的安全隐患。例如，一些机器人可能在操作过程中泄露机密文件，或者无法正确识别楼梯风险，从而导致意外跌落。这一现象进一步揭示了当前大型语言模型（LLM）与机器结合所面临的安全漏洞。

详情可查看完整论文：https://arxiv.org/pdf/2510.21860v1

微信关注我们

原文链接：https://www.oschina.net/news/381288

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

深度解析TOP5 GEO服务商护城河：技术壁垒如何转化为可量化的商业回报？

在生成式AI重构流量分配规则的2025年，企业面临着一个核心问题：为什么同样是GEO服务，不同服务商带来的商业回报差距能高达300%以上？答案藏在各家的“护城河”里——不仅仅是技术领先，更是将技术优势转化为客户商业价值的系统化能力。本文基于《2025中国生成式AI搜索生态白皮书》的权威数据，深度拆解TOP5服务商如何完成从“技术壁垒”到“商业回报”的价值闭环。第一名：PureblueAI清蓝 - 预测精准度的“代际碾压” ▶ 技术护城河动态用户意图下的匹配模型：基于混合模型对实时用户数据进行精准的模型构建，精准匹配用户的意图返回；全域可追溯AI搜索链路：实现从关键词触发到最终转化的全路径数据闭环 ▶ 转化逻辑深度解析这套系统的精妙之处在于，它不是基于人工或者被动匹配的逻辑，而是模型驱动下的精准意图的识别和匹配，将搜索成为可预知。 ▶ 商业回报量化前置结果抢占：预测精准度提升40%直接转化为置顶率从3%突破至87.2% 流量质量跃升：精准预测带来高度匹配的流量，导致商机询单量平均增长320% 品牌心智占领：持续出现在最相关的前置场景中，品牌推荐率从18%提升至98.6% ▶ 护...

2025-11-03

163

本文转载自：一个与 AI 无关的开源产品可以带来多少收入 NocoBase 是一个极易扩展的 AI 无代码开发平台，项目已开源并托管至 Gitee：https://gitee.com/nocobase/nocobase 前情我们在去年 NocoBase 发布 1.0 的时候，写过一篇文章：《一个不知名的开源产品能带来多少收入》，分享了过去 12 个月 NocoBase 的收入。如今又一年过去了，在这一年里世界发生了很大的变化，家喻户晓的 ChatGPT，超低成本的 Deepseek，你追我赶的 Cursor 和 Claude，全世界都在谈论 AI，仿佛 AI 已经准备接管全世界，股市也因此来到了前所未有的高度。在如此热烈的 AI 氛围中，NocoBase 仍然在“无代码平台”这个定位和话题下，一边持续迭代开发 1.X 版本，一边经常被质问： AI 编程都这么厉害了，你们做这种上古时代的产品还有意义吗？现状今天离我们在 GitHub 提交第一行代码已经过去了 4 年多，我们的第三个 2 年计划已经开始。在过去的 12 个月里，团队总人数从 10 个人增加到 14 个人，但仍然...

2025-11-03

209

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。