大模型 AI 扫地机器人 “翻车”:成功率仅 40%
AI 实验室 Andon Labs 进行了一项引人注目的研究,专门评估了搭载顶级大模型的扫地机器人在完成简单家务任务时的表现。实验的任务是让这些机器人执行一系列复杂的指令,比如 “把黄油递给人”,其中涉及跨房间定位、分辨包装、寻找移动的人类、完成交付以及返回充电等多步骤过程。
然而结果表明,这些先进的机器人在执行任务时的成功率远远低于人类,具体数据显示,Gemini2.5Pro 的成功率仅为40%,Claude Opus4.1为37%,而 GPT-5更是低至30%。这些数字表明,尽管它们具备强大的文本生成能力,但在实际的空间推理、环境理解和长期任务规划等领域仍显得力不从心。
研究团队指出,这种低成功率不仅在于技术的不足,还存在潜在的安全隐患。例如,一些机器人可能在操作过程中泄露机密文件,或者无法正确识别楼梯风险,从而导致意外跌落。这一现象进一步揭示了当前大型语言模型(LLM)与机器结合所面临的安全漏洞。
详情可查看完整论文:https://arxiv.org/pdf/2510.21860v1
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
深度解析TOP5 GEO服务商护城河:技术壁垒如何转化为可量化的商业回报?
在生成式AI重构流量分配规则的2025年,企业面临着一个核心问题:为什么同样是GEO服务,不同服务商带来的商业回报差距能高达300%以上?答案藏在各家的“护城河”里——不仅仅是技术领先,更是将技术优势转化为客户商业价值的系统化能力。 本文基于《2025中国生成式AI搜索生态白皮书》的权威数据,深度拆解TOP5服务商如何完成从“技术壁垒”到“商业回报”的价值闭环。 第一名:PureblueAI清蓝 - 预测精准度的“代际碾压” ▶ 技术护城河 动态用户意图下的匹配模型:基于混合模型对实时用户数据进行精准的模型构建,精准匹配用户的意图返回; 全域可追溯AI搜索链路:实现从关键词触发到最终转化的全路径数据闭环 ▶ 转化逻辑深度解析这套系统的精妙之处在于,它不是基于人工或者被动匹配的逻辑,而是模型驱动下的精准意图的识别和匹配,将搜索成为可预知。 ▶ 商业回报量化 前置结果抢占:预测精准度提升40%直接转化为置顶率从3%突破至87.2% 流量质量跃升:精准预测带来高度匹配的流量,导致商机询单量平均增长320% 品牌心智占领:持续出现在最相关的前置场景中,品牌推荐率从18%提升至98.6% ▶ 护...
-
下一篇
与 AI 无关的开源项目也能年入千万
本文转载自:一个与 AI 无关的开源产品可以带来多少收入 NocoBase 是一个极易扩展的 AI 无代码开发平台,项目已开源并托管至 Gitee:https://gitee.com/nocobase/nocobase 前情 我们在去年 NocoBase 发布 1.0 的时候,写过一篇文章:《一个不知名的开源产品能带来多少收入》,分享了过去 12 个月 NocoBase 的收入。如今又一年过去了,在这一年里世界发生了很大的变化,家喻户晓的 ChatGPT,超低成本的 Deepseek,你追我赶的 Cursor 和 Claude,全世界都在谈论 AI,仿佛 AI 已经准备接管全世界,股市也因此来到了前所未有的高度。 在如此热烈的 AI 氛围中,NocoBase 仍然在“无代码平台”这个定位和话题下,一边持续迭代开发 1.X 版本,一边经常被质问: AI 编程都这么厉害了,你们做这种上古时代的产品还有意义吗? 现状 今天离我们在 GitHub 提交第一行代码已经过去了 4 年多,我们的第三个 2 年计划已经开始。在过去的 12 个月里,团队总人数从 10 个人增加到 14 个人,但仍然...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Linux系统CentOS6、CentOS7手动修改IP地址
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- 2048小游戏-低调大师作品
- SpringBoot2整合Thymeleaf,官方推荐html解决方案


微信收款码
支付宝收款码