强化学习快餐教程(2) - atari游戏
强化学习快餐教程(2) - atari游戏
不知道看了上节的内容,大家有没有找到让杆不倒的好算法。
现在我们晋阶一下,向世界上第一种大规模的游戏机atari前进。
太空入侵者
可以通过
pip install atari_py
来安装atari游戏。
下面我们以SpaceInvaders-v0为例看下Atari游戏的环境的特点。
图形版
在太空入侵者中,支持的输入有6种,一个是什么也不做,一个是开火,另4个是控制方向:
- 0: NOOP
- 1: FIRE
- 2: UP
- 3: RIGHT
- 4: LEFT
- 5: DOWN
我们从环境中获取的信息是什么呢?很不幸,是一个(210, 160, 3)的图片,显示出来是这样的:
我们写代码把这个环境搭起来。策略嘛,我就原地不动一直开火。
import gym from skimage import io env = gym.make(
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
强化学习快餐教程(3) - 一条命令搞定atari游戏
强化学习快餐教程(3) - 一条命令搞定atari游戏 通过上节的例子,我们试验出来,就算是像cartpole这样让一个杆子不倒这样的小模型,都不是特别容易搞定的。 那么像太空入侵者这么复杂的问题,建模都建不出来,算法该怎么写? 别急,我们从强化学习的基础来讲起,学习马尔可夫决策过程,了解贝尔曼方程、最优值函数、最优策略及其求解。然后学习动态规划法、蒙特卡洛法、时间差分法、值函数近似法、策略梯度法。再然后我们借用深度学习的武器来武装强化学习算法,我们会学习DQN算法族,讲解2013版的基于Replay Memory的DQN算法,还有2015年增加了Target网络的新DQN算法,还有Double DQN、优先级回放DQN和Dueling DQN,以及PG算法族的DPG,Actor-Critic,DDPG,以及A3C算法等等。 有的同学表示
- 下一篇
强化学习快餐教程(1) - gym环境搭建
强化学习快餐教程(1) - gym环境搭建 欲练强化学习神功,首先得找一个可以操练的场地。两大巨头OpenAI和Google DeepMind都不约而同的以游戏做为平台,比如OpenAI的长处是DOTA2,而DeepMind是AlphaGo下围棋。 下面我们就从OpenAI为我们提供的gym为入口,开始强化学习之旅。 OpenAI gym平台安装 安装方法很简单,gym是python的一个包,通过pip安装即可。例: pip3 install gym --user 源代码的下载地址在:https://github.com/openai/gym gym平台的目的就是提供一个供强化学习进行比较和交流的标准化平台。 第一个gym游戏:cart pole cart pole是一个最简单的小游戏模型,它是一个一维的小车上竖起一根棍子,然后通过调整左右来保证棍
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Mario游戏-低调大师作品
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Red5直播服务器,属于Java语言的直播服务器
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,CentOS7官方镜像安装Oracle11G