云栖科技评论第22期:DeepMind官方确认Master身份:就是 AlphaGo!
1、DeepMind官方确认Master身份:就是 AlphaGo!
DeepMind官方确认Master身份:就是 AlphaGo!
【新闻摘要】我就是 AlphaGo!1月4日晚,Master的神秘面纱终于被揭开了!AlphaGo 的关键在于使用两种不同的神经网络:第一种叫策略网络,用来预测下一步;第二种叫价值网络,用来预测棋盘上不同的分布会带来哪些不同的结果。AlphaGo把非常复杂的搜索树减少到可操作的规模,所以,它并不是在每一步都要考虑几百种步数,而只考虑政策网络提供的几十种最有前景的步法,价值网络的作用是减少搜索的深度,它并不是一下子搜索出直达比赛末尾的300多步,而是搜索更少的步数,比如20多步,并评估这些位置,而不是一路评估到底,看谁最终能赢。搜索并不是靠蛮力,而是与某种和想象力相似的东西。新闻链接
【小云评论】Alp