谷歌 DeepMind 推出双 AI 机器人系统
谷歌DeepMind刚刚发布的Gemini Robotics项目展示了两个协同工作的全新模型,首次实现了能够在行动前进行"思考"的机器人系统。这一突破可能彻底改变当前机器人只能执行特定任务的局限性。
生成式AI技术在文本、图像、音频和视频创作领域已经变得司空见惯,而现在同样的技术正在被应用于输出机器人动作指令。DeepMind团队认为,生成式AI对机器人技术具有独特重要性,因为它能够解锁通用功能特性。
当前机器人面临的核心问题是过度专业化。每个机器人都需要针对特定任务进行密集训练,在执行其他任务时表现糟糕。谷歌DeepMind机器人部门负责人Carolina Parada指出:"今天的机器人高度定制化且部署困难,通常需要数月时间才能安装一个只能执行单一任务的机器人单元。"
生成式系统的基础特性让AI驱动的机器人变得更加通用。它们可以面对全新的环境和工作空间,无需重新编程就能适应。DeepMind当前的机器人技术方法依赖于两个模型的协作:一个负责思考,一个负责执行。
这两个新模型分别命名为Gemini Robotics1.5和Gemini Robotics-ER1.5。前者是视觉-语言-动作模型,能够使用视觉和文本数据生成机器人动作指令。后者中的"ER"代表具身推理,这是一个视觉-语言模型,接收视觉和文本输入后生成完成复杂任务所需的步骤。
Gemini Robotics-ER1.5是首个具备模拟推理能力的机器人AI系统,类似于现代文本聊天机器人的推理过程。DeepMind称其为"思考"能力,尽管在生成式AI领域这个术语可能并不完全准确。据DeepMind介绍,ER模型在学术和内部基准测试中都取得了顶级成绩,表明它能够对如何与物理空间交互做出准确决策。但它本身不执行任何动作,这就需要Gemini Robotics1.5的配合。
以分拣洗衣物为例:当需要机器人将一堆衣物分成白色和彩色两类时,Gemini Robotics-ER1.5会处理这个请求并分析物理环境的图像。这个AI系统还能调用谷歌搜索等工具收集更多数据。然后ER模型生成自然语言指令,为机器人提供完成任务所需遵循的具体步骤。
这种双模型架构的创新之处在于将推理和执行分离。推理模型专注于理解任务需求和环境状况,制定详细的行动计划;执行模型则负责将这些计划转化为具体的机器人动作。这种分工协作的方式让机器人系统既具备了复杂的思考能力,又保持了精确的执行效率。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Zed 编辑器 AI 辅助编程功能改为“按 Token 用量收费”
开源代码编辑器 Zed 宣布其 AI 辅助功能的计费方式将从原先以“Prompt 提交次数/限制”模型,改为“Token-用量”计费,目的是使收费结构与实际运行成本更紧密对齐,同时给予用户使用上的灵活性。 核心变动细节 新定价立即对新用户生效;现有 Pro 订阅用户将有三个月的迁移期。 Free(免费)用户将在 2025 年 10 月中旬切换到新方案。免费用户虽不再受 prompt 次数限制,但编辑预测(edit predictions)的功能仍有次数限制。 新增/扩展支持的 AI 模型包括 GPT-5(mini/nano 版本)、Gemini 2.5 Pro 与 Gemini 2.5 Flash,以及继续支持 Anthropic 等模型。 定价架构与用户选项 Pro 用户月费约 US$10,含 US$5 的 token credit;超出部分按模型官方 API 列表价+10% 收费。 免费用户可自行使用第三方 API key 或本地模型、以及外部 agent,比如 Gemini CLI、Claude Code 等方式来启动或增强 AI 功能。也可完全关闭所有 AI 功能。 Zed 同...
-
下一篇
李开复:AI Agent 是 CEO 最需要关注的核心技术
零一万物 CEO、创新工场董事长李开复在零一万物“‘元启上海’华东数智大会”上表示,从“大模型”到“智能体”,从理解到执行与交付,AI将重塑企业的组织结构,形成“超级员工”模式,创造万亿级价值。 李开复指出,企业“不是为了AI(人工智能)而AI,是为了增长而AI”。他认为,当企业不再为模型买单,而是为“结果”与“价值”付费时,AI创造的价值将从降本转向增效。在零一万物看来,Agent有望成为推动企业智能化变革的核心力量。 他强调,Agent是公司CEO最需关注的核心技术,这也就是零一万物所强调的“一把手工程”战略:“Agent带来的不是一个软件工具,不是一个效率的提升,而是能够创造一个有史以来最高效的组织架构。” 在随后的采访中,李开复对澎湃新闻等媒体表示,基础模型就像是飞机的发动机,零一万物的万智企业Agent及大模型定制解决方案则是让飞机飞得更高的平台:“我们认为,在部署智能体方面,需要一个 AI 公司和一个传统公司‘一把手’互相合作。零一万物是今天我们所认知的所有AI公司里面,最愿意派这种前置工程师去和传统公司共创的。” 李开复认为,在代码对接、推理强度和私有化部署等方面,零一万...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Mario游戏-低调大师作品
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2全家桶,快速入门学习开发网站教程
- Crontab安装和使用
- CentOS7,CentOS8安装Elasticsearch6.8.6