强化学习快餐教程(1) - gym环境搭建
强化学习快餐教程(1) - gym环境搭建
欲练强化学习神功,首先得找一个可以操练的场地。
两大巨头OpenAI和Google DeepMind都不约而同的以游戏做为平台,比如OpenAI的长处是DOTA2,而DeepMind是AlphaGo下围棋。
下面我们就从OpenAI为我们提供的gym为入口,开始强化学习之旅。
OpenAI gym平台安装
安装方法很简单,gym是python的一个包,通过pip安装即可。
例:
pip3 install gym --user
源代码的下载地址在:https://github.com/openai/gym
gym平台的目的就是提供一个供强化学习进行比较和交流的标准化平台。
第一个gym游戏:cart pole
cart pole是一个最简单的小游戏模型,它是一个一维的小车上竖起一根棍子,然后通过调整左右来保证棍