Caffe2推出强化学习库,包含多个基于Caffe2的RL实现
今年4月,Facebook正式发布了轻量化和模块化的深度学习框架Caffe2。将近5个月后今天,Caffe2又推出了一组强化学习库RL_Caffe2。
强化学习(Reinforcement learning,RL)是机器学习的一个领域,它想教会智能体动作和行为的关系,并在环境中持续一段时间后将奖励最大化。
智能体可以是游戏代理、推荐系统、通知机器人或其他的决策系统。奖励可以是游戏中的点数、或者是网站上更多的参与度。
这个开源的Caffe2 RL框架中包含了一些在OpenAI Gym环境下基于Caffe2的RL实现:
1.DQN
一种Deep Q Learning网络的实现:
https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf.
2.SARSA
这是假设输入是既定策略