【代码+教程】重现“世界模型”实验,无监督方式快速训练
“世界模型”(World Models)是谷歌大脑研究科学家 David Ha 和 Swiss AI Lab 负责人 Jürgen Schmidhuber 共同提出的一个为强化学习环境构建的神经网络模型。世界模型可以通过无监督的方式快速训练,让人工智能在 “梦境” 中对外部环境的未来状态进行预测,大幅提高了完成任务的效率。这篇论文一经发布就引发了热烈讨论。
近日,论文作者之一的 David Ha 公布了重现世界模型实验的一种方法,本文带来分步解读。GitHub 上的参考 TensorFlow 模型:https://github.com/hardmaru/WorldModelsExperiments
已有其他人独立实现了世界模型。Keras 有一个实现再现了 CarRacing-v0 实验的一部分。PyTorch 也有一个项目,试图在