用DeepMind教AI玩游戏?一文为你讲清原理!
DeepMind到底是如何教AI玩游戏的?这篇在Medium上获得1700个赞的文章,把里面的原理讲清楚了。
谷歌的DeepMind是世界一流的AI研究团队,其研发的AlphaGo在2016年备受瞩目的人机大战中击败了韩国围棋冠军李世石(Lee Sedol),一战成名。AlphaGo背后的关键技术就是深度强化学习(Deep Reinforcement Learning)。
这篇论文讲了些什么?
这得从4年前说起。
彼时,DeepMind开发了一个AI程序,它能玩Atari公司70年代推出的一系列游戏,如Breakout(打砖块)、弹球游戏《Pong》和《太空入侵者》(Space Invaders)。正是由于这项研究,谷歌收购了DeepMind,同时它也奠定了AlphaGo的基础。
《太空入侵者》
今天我们将逐段解析原研究论文《Playin