谷歌推出 RT-2,能够像人类一样思考和行动
谷歌宣布推出首个 Robotics Transformer 2 (RT-2) 视觉-语言-动作 (VLA) 模型。可以从网络和机器人数据中学习,并将这些知识转化为用于机器人控制的通用指令,同时保留 web-scale 能力。
“RT-2 显示出超越其所接触的机器人数据的泛化能力以及语义和视觉理解能力。这包括解释新命令并通过执行基本推理(例如关于对象类别或高级描述的推理)来响应用户命令。 ”
根据介绍,RT-2 是一个基于 Transformer 的模型,通过网络上的文本和图像进行训练,并能直接输出机器人行为指令。就如同语言模型从网络文本中学习通用概念和思想,RT-2 也从网页数据中吸取知识以驱动机器人行为。“换句话说,RT-2 可以说机器人语言。”
去年,谷歌 DeepMind 的机器人团队曾展示了 Robotics Transformer (RT-1),可训练日常机器人系统执行诸如拾放和开启抽屉等任务。该系统基于包含 130,000 次演示的数据库,据团队称,有“超过 700”项任务的成功率达到 97%。
谷歌 DeepMind 机器人技术主管 Vincent Vanhoucke 在博客中表示,RT-1 表明,以跨系统泛化信息能力而著称的 Transformer 甚至可以帮助不同类型的机器人相互学习。
RT-2 建立在 RT-1 模型的基础上,消除了一些复杂性;使单个模型不仅能够执行基础模型中看到的复杂推理,而且还可以输出机器人动作。最重要的是,它表明在少量的机器人训练数据下,该系统就能够将其语言和视觉训练数据中嵌入的概念转移到指导机器人行为 —— 即使是对于从未接受过训练的任务。
“例如,如果想要以前的系统能够执行丢弃垃圾的行为,必须明确训练它识别和处理垃圾。然而,RT-2 可以从大量网络数据中学习并理解什么是垃圾,并在未经特定训练的情况下进行识别。尽管未曾接受过相关动作训练,但它甚至掌握了如何丢弃垃圾的方法。考虑到垃圾的抽象性 —— 比如各种薯片包装或香蕉皮在你食用后就成为了垃圾,RT-2 能通过其视觉语言培训数据理解这个概念,并完成任务。”
Vincent 称,RT-2 的能力在于将信息转化为行动,这显示了其快速适应新环境和情况的潜力。经过 6000 次的测试试验表明,RT-2 在训练数据中的任务或"seen"任务上的表现与 RT-1 模型相当。而在未见过的新场景中,RT-2 的性能表现几乎翻了一番,从 RT-1 的 32% 提高到了 62%。
“换句话说,通过 RT-2,机器人能够像我们一样学习更多内容 —— 将学到的概念迁移到新的情境中。RT-2 不仅展示了人工智能的进步如何迅速渗透到机器人领域,而且还展示了更多通用机器人的巨大前景。虽然要在以人为本的环境中打造有用的机器人还有大量工作要做,但 RT-2 向我们展示了机器人技术令人兴奋的未来。”
更多详情可查看官方博客。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
自托管 ONLYOFFICE 协作空间现已发布:用自己的方式进行安全协作
现在可以将 ONLYOFFICE 协作空间安装在私人服务器上了,您可以完全掌控所有数据,以及享受其他自托管的优点。目前用于 Linux 服务器安装的协作空间已发布,其他软件包将会陆续推出。请阅读下文了解详情。 关于 ONLYOFFICE协作空间 ONLYOFFICE协作空间是一个在线协作平台,用户在可定制的房间中编辑和协作处理文档、电子表格、演示文稿和表单。 内置的 ONLYOFFICE 文档套件具有专业的编辑工具以及实时文档编辑、聊天功能、通过 Jitsi 和 Zoom 进行音频/视频通话以及所有必备的协作功能。该平台支持各种文件格式,包括 Word 文档、电子表格、演示文稿、PDF 和多媒体。 协作是在房间内进行的,可以给用户设置各种级别的访问权限以简化协作流程:房间管理员、高级用户、可编辑、可查看、可评论、可审阅和可填写表单。轻松共享文件和邀请用户,让团队内外的协作更简单。 安全功能包括加密、活动跟踪、IP 限制、SSO 等。用户可以自定义协作空间的外观和风格,应用自己的品牌和定制,可在设置中执行更多操作。 协作空间云 VS 本地部署 选择用在线软件作为服务,还是将其托管在自己的...
- 下一篇
火绒安全升级版本,导致所有基于 Electron 的应用卡顿
有网友反馈称,周末升级火绒安全后,发现部分应用出现卡顿的情况,包括 VS Code、新版 NT 架构的 Windows QQ 等应用全部存在问题。 从用户反馈来看,出现卡顿的应用基于 Electron 框架开发,其他不是基于此框架开发的应用则没有问题。 以腾讯 QQ 为例,更新火绒安全后,腾讯 QQ 各种界面的操作都出现明显卡顿。打开任务管理器可以观察到此时火绒安全软件的安全服务模块占用大量处理器和内存资源,进而导致系统卡顿。 遇到该问题后,部分用户尝试禁用火绒安全或卸载火绒安全,通过此操作可以解决问题,系统恢复正常使用。 昨天凌晨,火绒团队发布回复称这个问题将在晚些时候解决,之后用户会自动接收到版本更新推送,升级后问题不再复现。不过火绒安全团队并未发布详细说明解释导致问题的原因。 目前火绒安全已经发布新版本修复该问题,经用户测试,升级到最新版本火绒安全后该问题已经不再复现。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19