强化学习快餐教程(1) - gym环境搭建
强化学习快餐教程(1) - gym环境搭建
欲练强化学习神功,首先得找一个可以操练的场地。
两大巨头OpenAI和Google DeepMind都不约而同的以游戏做为平台,比如OpenAI的长处是DOTA2,而DeepMind是AlphaGo下围棋。
下面我们就从OpenAI为我们提供的gym为入口,开始强化学习之旅。
OpenAI gym平台安装
安装方法很简单,gym是python的一个包,通过pip安装即可。
例:
pip3 install gym --user
源代码的下载地址在:https://github.com/openai/gym
gym平台的目的就是提供一个供强化学习进行比较和交流的标准化平台。
第一个gym游戏:cart pole
cart pole是一个最简单的小游戏模型,它是一个一维的小车上竖起一根棍子,然后通过调整左右来保证棍
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
强化学习快餐教程(2) - atari游戏
强化学习快餐教程(2) - atari游戏 不知道看了上节的内容,大家有没有找到让杆不倒的好算法。现在我们晋阶一下,向世界上第一种大规模的游戏机atari前进。 太空入侵者 可以通过 pip install atari_py 来安装atari游戏。 下面我们以SpaceInvaders-v0为例看下Atari游戏的环境的特点。 图形版 在太空入侵者中,支持的输入有6种,一个是什么也不做,一个是开火,另4个是控制方向: 0: NOOP 1: FIRE 2: UP 3: RIGHT 4: LEFT 5: DOWN 我们从环境中获取的信息是什么呢?很不幸,是一个(210, 160, 3)的图片,显示出来是这样的: 我们写代码把这个环境搭起来。策略嘛,我就原地不动一直开火。 import gym from skimage import io env = gym.make(
- 下一篇
Javascript类型推断(3) - 算法模型解析
Javascript类型推断(3) - 算法模型解析 构建训练模型 上一节我们介绍了生成训练集,测试集,验证集的方法,以及生成词表的方法。这5个文件构成了训练的基本素材: files = { 'train': { 'file': 'data/train.ctf', 'location': 0 }, 'valid': { 'file': 'data/valid.ctf', 'location': 0 }, 'test': { 'file': 'data/test.ctf', 'location': 0 }, 'source': { 'file': 'data/source_wl', 'location': 1 }, 'target': { 'file': 'data/target_wl', 'loc
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装