DeepMind 强化学习团队副总裁:AI 的未来在于自主获取经验
近日,Google DeepMind 强化学习团队副总裁 David Silver 近日在一场重要播客中提出了关于 AI 未来发展的关键观点。 作为 DeepMind 创始成员和 AlphaGo 项目的核心人物,Silver 认为 AI 未来的突破将来自于其自主获取经验的能力,而非继续依赖人类数据。 Silver 在访谈中指出,AI 发展正从「人类数据时代」迈向「经验时代」。他解释道: 目前的 AI 方法基于一个共同理念:提取人类拥有的全部知识并’喂’给机器。但真正的突破将来自于机器与世界互动,产生自身经验的能力。 以 AlphaGo 和 AlphaZero 为例,Silver 阐述了 AI 自主学习的威力。AlphaZero 通过完全摒弃人类棋谱数据,仅靠自我对弈获取经验,反而达到了超越人类和早期版本 AlphaGo 的水平。他称这是 AI 领域的「苦涩教训」——人类知识有时反而会限制 AI 的自主学习能力。 Silver 还谈到了当前大语言模型中的强化学习应用。虽然基于人类反馈的强化学习(RLHF)帮助模型更符合人类偏好,但他认为这种方法无法让 AI 超越人类知识的「天花板」。「如...

