提到强化学习只知道AlphaGo?其实,RL在工业界还有这些应用
本文来自AI新媒体量子位(QbitAI) 关于作者: Ben Lorica,O’Reilly Media的首席数据科学家,同时是Strata Data Conference和O’Reilly Artificial Intelligence Conference的项目主任。 AlphaGo Zero的出现让人们再次提起了对强化学习的兴趣。紧随深度学习之后,强化学习成为了目前AI领域最热门的话题。 大部分公司对强化学习这个事做了调查和评估,然而很少有人真正搞明白它究竟能做什么。 考虑到RL的概念现在已经被混淆进了一大坨乱七八糟的问题和技术里,我们有必要先给它下个定义。 一般而言,RL的目标是学会如何将观测结果和测量值映射到一系列行为,同时最大化长期奖励。这个概念通常将那些“智能体与环境进行交互并学会最佳决策序列”的应用包括在内。 事实上,很多RL

