谷歌推出 RT-2，能够像人类一样思考和行动-低调大师

谷歌推出 RT-2，能够像人类一样思考和行动

2023-07-31 340

谷歌宣布推出首个 Robotics Transformer 2 (RT-2) 视觉-语言-动作 (VLA) 模型。可以从网络和机器人数据中学习，并将这些知识转化为用于机器人控制的通用指令，同时保留 web-scale 能力。

“RT-2 显示出超越其所接触的机器人数据的泛化能力以及语义和视觉理解能力。这包括解释新命令并通过执行基本推理（例如关于对象类别或高级描述的推理）来响应用户命令。 ”

根据介绍，RT-2 是一个基于 Transformer 的模型，通过网络上的文本和图像进行训练，并能直接输出机器人行为指令。就如同语言模型从网络文本中学习通用概念和思想，RT-2 也从网页数据中吸取知识以驱动机器人行为。“换句话说，RT-2 可以说机器人语言。”

去年，谷歌 DeepMind 的机器人团队曾展示了 Robotics Transformer (RT-1)，可训练日常机器人系统执行诸如拾放和开启抽屉等任务。该系统基于包含 130,000 次演示的数据库，据团队称，有“超过 700”项任务的成功率达到 97%。

谷歌 DeepMind 机器人技术主管 Vincent Vanhoucke 在博客中表示，RT-1 表明，以跨系统泛化信息能力而著称的 Transformer 甚至可以帮助不同类型的机器人相互学习。

RT-2 建立在 RT-1 模型的基础上，消除了一些复杂性；使单个模型不仅能够执行基础模型中看到的复杂推理，而且还可以输出机器人动作。最重要的是，它表明在少量的机器人训练数据下，该系统就能够将其语言和视觉训练数据中嵌入的概念转移到指导机器人行为 —— 即使是对于从未接受过训练的任务。

“例如，如果想要以前的系统能够执行丢弃垃圾的行为，必须明确训练它识别和处理垃圾。然而，RT-2 可以从大量网络数据中学习并理解什么是垃圾，并在未经特定训练的情况下进行识别。尽管未曾接受过相关动作训练，但它甚至掌握了如何丢弃垃圾的方法。考虑到垃圾的抽象性 —— 比如各种薯片包装或香蕉皮在你食用后就成为了垃圾，RT-2 能通过其视觉语言培训数据理解这个概念，并完成任务。”

Vincent 称，RT-2 的能力在于将信息转化为行动，这显示了其快速适应新环境和情况的潜力。经过 6000 次的测试试验表明，RT-2 在训练数据中的任务或"seen"任务上的表现与 RT-1 模型相当。而在未见过的新场景中，RT-2 的性能表现几乎翻了一番，从 RT-1 的 32% 提高到了 62%。

“换句话说，通过 RT-2，机器人能够像我们一样学习更多内容 —— 将学到的概念迁移到新的情境中。RT-2 不仅展示了人工智能的进步如何迅速渗透到机器人领域，而且还展示了更多通用机器人的巨大前景。虽然要在以人为本的环境中打造有用的机器人还有大量工作要做，但 RT-2 向我们展示了机器人技术令人兴奋的未来。”

更多详情可查看官方博客。

微信关注我们

原文链接：https://www.oschina.net/news/251721/google-rt-2

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

自托管 ONLYOFFICE 协作空间现已发布：用自己的方式进行安全协作

现在可以将 ONLYOFFICE 协作空间安装在私人服务器上了，您可以完全掌控所有数据，以及享受其他自托管的优点。目前用于 Linux 服务器安装的协作空间已发布，其他软件包将会陆续推出。请阅读下文了解详情。关于 ONLYOFFICE协作空间 ONLYOFFICE协作空间是一个在线协作平台，用户在可定制的房间中编辑和协作处理文档、电子表格、演示文稿和表单。内置的 ONLYOFFICE 文档套件具有专业的编辑工具以及实时文档编辑、聊天功能、通过 Jitsi 和 Zoom 进行音频/视频通话以及所有必备的协作功能。该平台支持各种文件格式，包括 Word 文档、电子表格、演示文稿、PDF 和多媒体。协作是在房间内进行的，可以给用户设置各种级别的访问权限以简化协作流程：房间管理员、高级用户、可编辑、可查看、可评论、可审阅和可填写表单。轻松共享文件和邀请用户，让团队内外的协作更简单。安全功能包括加密、活动跟踪、IP 限制、SSO 等。用户可以自定义协作空间的外观和风格，应用自己的品牌和定制，可在设置中执行更多操作。协作空间云 VS 本地部署选择用在线软件作为服务，还是将其托管在自己的...

2023-07-31

506

有网友反馈称，周末升级火绒安全后，发现部分应用出现卡顿的情况，包括 VS Code、新版 NT 架构的 Windows QQ 等应用全部存在问题。从用户反馈来看，出现卡顿的应用基于 Electron 框架开发，其他不是基于此框架开发的应用则没有问题。以腾讯 QQ 为例，更新火绒安全后，腾讯 QQ 各种界面的操作都出现明显卡顿。打开任务管理器可以观察到此时火绒安全软件的安全服务模块占用大量处理器和内存资源，进而导致系统卡顿。遇到该问题后，部分用户尝试禁用火绒安全或卸载火绒安全，通过此操作可以解决问题，系统恢复正常使用。昨天凌晨，火绒团队发布回复称这个问题将在晚些时候解决，之后用户会自动接收到版本更新推送，升级后问题不再复现。不过火绒安全团队并未发布详细说明解释导致问题的原因。目前火绒安全已经发布新版本修复该问题，经用户测试，升级到最新版本火绒安全后该问题已经不再复现。

2023-07-31

972

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。