IBM Research 创建了衡量 AI 的新基准:AGENT
IBM Research 宣布创建了 AGENT,一个评估 AI 模型核心心理推理能力或常识的基准。“它将使我们能够构建和测试 AI 模型,以与人类相同的方式推理和学习其他思维。”
IBM 研究软件工程师 Abishek Bhandwaldar 和 MIT 博士后 Tianmin Shu 在一篇博客中表示,“我们已经在构建可以推断心理状态、预测未来行为甚至与人类合作伙伴合作的 AI 代理方面取得了进展。然而,我们还缺乏一个严格的基准来评估人工智能模型的核心心理推理能力 —— 它的常识。”
基于此,他们创建并验证了 AGENT(Action、Goal、Efficiency、constraint、uTility)基准。AGENT 被用于挑战两个基线模型,并使用 IBM 开发的专注于泛化的协议评估了它们的性能。结果表明,该基准可用于评估任何 AI 模型的核心心理推理能力;以了解其社会意识以及在现实世界中与人类互动的潜力。
根据介绍,AGENT 是一个大型 3D 动画数据集,其中包含在各种物理约束下移动并与各种对象交互的代理;灵感来自探索幼儿认知发展的实验。这些视频中包含了不同的试验,每个试验都包括一个或多个代理在特定物理环境中的典型行为的“familiarization”视频,以及同一代理在新环境中的行为的“test”视频;鉴于 agent 在相应的熟悉视频中的行为,这些视频则被标记为"expected"或"surprising"。
这些试验评估了一组最小的关键常识概念,这些概念被认为是幼儿核心心理学的一部分。试验分为四种情况:目标偏好、行动效率、未观察到的约束和成本回报权衡。每个场景都有几个变体或类型,基本版本复制婴儿研究中使用的刺激,以及更多样化和更具挑战性的其他设置。
更多详情可查看官方博客。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Trivy —— 使用 Go 语言开发的容器漏洞扫描工具
Trivy 是一个简单而且功能完整的容器漏洞扫描工具,特别使用用于持续集成。 准确性比较 在 Alpine Linux 中检测的漏洞(2019/05/12) 详细的比较请看Comparison with other scanners 特性 全面检测漏洞 操作系统 (Alpine,Red Hat Universal Base Image, Red Hat Enterprise Linux, CentOS, Debian and Ubuntu) 应用依赖(Bundler, Composer, Pipenv, npm, yarn and Cargo) 简单 Specify only an image name 详情请看Quick Start和Examples 易于安装 No need for prerequirementssuch as installation of DB, libraries, etc. apt-get install , yum install and brew install is possible (SeeInstallation) 准确度高 Especially ...
- 下一篇
Ampere Computing 将以每月为周期发布开源固件
今年年初,Ampere Computing 宣布将致力于支持固件生态系统中的开源,并为他们的 Ampere Altra 处理器和 Mount Jade 平台开发开源固件,如今他们承诺将每月发布一次开源固件。 Ampere Computing(以下简称 Ampere)是一家由 Renee James(英特尔前总裁) 在 2017 年于美国成立的半导体公司,总部设在圣克拉拉。专注于开发以 ARM 为基础的计算机处理器。2019 年,Arm 与甲骨文先后向 Ampere 投资,为 Ampere 后续的发展提供了支持。 Ampere 专注于云和边缘计算数据中心领域,并凭借 Ampere Altra 处理器杀入了已被英特尔和 AMD 统治的服务器领域。 通过近几年时间的发展,Ampere 已经证明了自己是迄今为止最有能力的 AArch64 服务器供应商,他们的新产品 Ampere Altra Max 拥有 128 个内核,在性能上可以与 AMD 和英特尔的最新产品竞争,而且由于 ARM 架构的特性,Ampere Altra Max 在能耗上显著优于竞争对手。 Ampere 在其官方博客上写道:"...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS关闭SELinux安全模块
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Windows10,CentOS7,CentOS8安装Nodejs环境