重磅 | 阿里推出多智能体双向协调网络BicNet，玩《星际争霸》堪比人类-低调大师

重磅 | 阿里推出多智能体双向协调网络BicNet，玩《星际争霸》堪比人类

2017-05-22 444

过去十年中，人工智能取得了长足的进步，在图像和语音识别上已经在某种程度上超越了人类。而通过反馈奖励，单个的AI智能体也能在雅达利这样的视频游戏和围棋中战胜人类。

但人类真正的智能还包括了社会和集体智能，这也是实现通用智能必不可少的。就像虽然单个蚂蚁的智能有限，但通过协作它们能狩猎，能筑巢，能发动战争。毫无疑问，人工智能的下一个挑战就是让大规模的AI智能体学习人类水平的协作与竞争。

协作的一个例子就是星际这样的即时战略游戏。雷锋网消息，最近阿里巴巴与伦敦大学的研究人员们，就在一篇论文中展示了如何用星际争霸作为测试场景，让智能体协同工作，在多对一和多对多中打败敌人。

掩护攻击

这项研究主要关注星际中的微管理任务，每个玩家控制自己的单位，在不同的地形条件下歼灭对手。星际这样的游戏对计算机来说可能是最困难的，因为它们的复杂程度比围棋要高得多。这种大型多智能体系统学习面临的主要挑战是，参数空间会随着参与人数的增加而呈指数级增长。

研究人员让多智能体把星际中的战斗当作零和随机游戏来学习。为了形成可扩展且有效的通讯协议，研究者引入了一个多智能体双向协调网络BiCNet，智能体可以通过它来交流。另外，研究中还引入了动态分组和参数共享的概念，来解决扩展性问题。

边打边跑策略

BiCNet可以处理不同地形下的不同类型的战斗，且对战时双方都有不同数量的AI智能体。

分析显示，在没有任何诸如人类示范或标签数据的监督时，BiCNet也能学习各类协调策略，而这些策略与经验丰富的玩家所展现出来的很相似，比如在不引发冲突的情况下移动，边打边跑等基本策略，以及掩护攻击与适度集中火力等高级技巧。

另外，BiCNet还可以轻易适应异构智能体任务。在实验中，研究者根据不同的场景对网络进行了评估，发现它表现优异，在大规模现实应用中有潜在价值。

研究中还发现，指定的奖励与学习策略之间存在很强的相关性。研究人员计划进一步研究这种关系，研究策略如何在智能体网络中传递，以及是否会出现特定的语言。另外，双方都通过深度多智能体模型来操作时，纳什均衡的的探讨也很有意义。

论文阅读：https://arxiv.org/pdf/1703.10069.pdf

本文来源于"中国人工智能学会",原文发表时间" 2017-04-05 "

微信关注我们

原文链接：https://yq.aliyun.com/articles/87181

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

演讲实录丨华刚计算机视觉的黄金时代：机遇与挑战

计算机视觉的黄金时代：机遇与挑战华刚微软亚洲研究院视觉计算组组长、资深计算机视觉专家华刚：大家下午好！今天报告题目是计算视觉的黄金时代，机遇与挑战。如果我们看到这个题目，关键字有几个，第一个是计算机视觉，第二个黄金时代，第三个第四个机遇挑战。基于这四个关键字给大家讲讲我的理解和看法。什么是计算机视觉？学术的观点定义领域的话，计算机视觉我们从图象和视频中间提取数值和符号计算机系统。我们说一个愿景能让计算机像人类一样看到并理解图象，我们认为是一个黄金时代回顾一下计算机视觉真正发展的历史。基本上来讲计算机视觉历史第一个萌芽阶段，1955年到1979年的时间，这个领域还是相对比较新的领域。在55年我们对于计算机视觉提出一个展望，在MIT一个暑期人工智能会议上。我们在三四个月内能不能把计算机视觉工作解决了，直到今天还没有完全解决。中间经历了很多发展，在70年代麻省理工真正成立研究小组，开设第一门计算机视觉课程。从今天来讲，我们看到会是非常简单一个图片，是一些像块状的物体，这是MIT第一篇博士论文。称之为萌芽阶段，大家处于一种探索状态，这个领域怎么走？早期期望说三个月把这个问题解...

2017-05-21

657

“ NLP 不是魔术，但是，其结果有时几乎就是魔术一般神奇。 ” 引自：http://www.confidencenow.com/nlp-seduction.htm 【立委按】说明一点，写这篇 NLP 联络图科普的时候深度学习还没火。 AI 还没有摇身一变，被 DL 所窃取。当时的机器学习界还在鄙视取笑并与 ai 保持距离。没想到现如今 AI 居然被看成了 DL 的同义词突然成了香饽饽。言必称神经，连 NLP 也被窃取了，也与dl划了等号。符号逻辑派的 AI 与规则系统的 NLP，做了一辈子，到头来连“家”都没了。一切皆是学习，一切都要神经。但我相信天变了，道却不变，因此下面的联络图或可超越神经一统天下的狭隘思维。拨乱反正，谈何容易。还是一家之言，愿者上钩吧。 (NLP Word Cloud, courtesy of ourselves who built the NLP engine to parse social media to generate this graph ) 【立委原按】样板戏《智取威虎山》里面，杨子荣怀揣一张秘密联络图而成为土匪头子座山雕的座上客，因...

2017-05-22

779

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。