谷歌DeepMind超级进化：国际象棋、围棋吊打世界冠军

2018-12-07 09:59新浪科技 - 樵夫

北京时间12月7日早间消息，Alphabet旗下人工智能部门DeepMind一年前宣布开发了一套名为AlphaZero的系统，它可以教会自己如何掌握国际象棋、日本将棋和中国围棋，而且都能击败世界冠军。

虽然DeepMind的说法令人印象深刻，但当时却未能通过同行评审。不过，DeepMind今天宣布，经过数月的反复修订，该公司在AlphaZero上的成果已经被《科学》杂志接受，并登上该杂志的首页。

“几年前，我们的AlphaGo以4:1击败了18次获得围棋世界冠军的棋手李世石。但对于我们来说，这实际上是构建一个通用学习系统的开始，这个系统可以自己学习不同的游戏，最终达到超越人类的水平。“AlphaZero的首席研究员大卫·西尔沃（David Silver）对参加蒙特利尔NeurIPS 2018大会的记者说，“AlphaZero是这一段旅程的下一步。它从头开始学习击败围棋、国际象棋和日本将棋的世界冠军。除了游戏规则外，它什么知识都没有。“

Silver解释说，选择这些游戏既考虑了它们的复杂性，也考虑了之前针对它们进行人工智能研究的丰富历史。

为此，本周发表的论文描述了DeepMind如何利用深度神经网络实现优于Stockfish、Elmo和IBM深蓝的游戏算法。

“传统引擎非常强大并且几乎没有明显的错误，但当面对没有具体和可计算解决方案的位置时，可能会发生漂移。”国际象棋大师马修·萨德勒（Matthew Sadler）说，“正是在这样的位置，AlphaZero才能实现‘感觉’，‘洞察力’或‘直觉’。“

为了测试经过全面训练的AlphaZero，除了其前身AlphaGo Zero之外，DeepMind的研究人员还对上述的Stockfish和Elmo游戏引擎进行了测试。在具有44个处理器内核和4个谷歌第一代TPU的单台机器上运行时，AlphaZero都能轻松赢得大多数比赛。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。