离开棋谱,气吞万里如虎:谷歌Master就这样横扫棋坛豪杰!
当年和围棋世界冠军李世石一战成名的AlphaGo又回来了,带着大师的名头,和一身的新本领。闭关修行后的AlphaGo棋力大涨,化身网络棋手“Master”,一举挫败当今棋坛60名顶尖高手,气吞万里如虎,无人能挡。
鉴于可能还有不少网友对这次AlphaGo重出江湖的来龙去脉不太熟悉,只是从间或的报道中了解了部分细节,IT之家这里不妨为大家先简单梳理一下。
事情起源于2016年12月29日,一个名为“Master(大师)”的账号出现在弈城围棋网上,号称韩国九段“网络棋手”,不断向其他九段的高手发起挑战。不过,这个名不见经传的棋手一开始并没有获得高手们的回应,也在情理之中。
由于未能获得直接和顶级高手过招的机会,Master开始改变策略,从一些段数稍低一些的对手打起,以此来引起注意。结果也正如其所愿,Master轻松扫灭各路棋手,其中包括谢尔豪四段、孟泰龄六段、于之莹五段等,首日打出了一波10:0的小高潮。对手虽不是世界顶级,但也毕竟有足够的分量,于是Master引起了棋手们的注意。
30日,刚刚展露头角的Master再次上线,这一天它迎来了10位对手,然而这10位最终都成为它刷成绩的“棋子”,其中甚至包括当今韩国围棋届第一人朴廷桓,这一战让Master名声大躁,同时,成绩刷新为20:00。
31日,各路高手被Master的战绩吸引过来,纷纷与之对战,其中包括新科百灵杯冠军陈耀烨九段、芈昱廷九段、唐韦星九段,以及此前战败的朴廷桓。但高手们连番轰炸似乎并没有对剧情的走向产生影响。当天,Master的战绩刷新为30:00。似乎是有组织有预谋的,一天10盘,不多不少,这时候,大家都开始猜测这位神秘的Master究竟是何方神圣?
跨年之后,Master开始转战另一个平台野狐网。1月1日,它的对手更加重量级,但这些都无法终止它连胜的纪录。而到了1月3日,Master已经获得了50场连胜,这第50盘的对手正是当今世界排名第一的柯洁,结果是柯洁中盘投子认输。
1月4日,神秘选手Master在第54场对局中迎来了“棋圣”聂卫平,引发外界极大的关注。而这一次,棋圣也没能阻止Master,双方交战至253手,聂卫平执白7目半负Master。而Master在对局结束后打出繁体字“谢谢聂老师”。
到这里,看起来已经没有人能够阻挡Master的脚步了,相比这个,大家更关心的是Master真实的身份,当时声音最多的是“Master”其实就是AlphaGo的马甲,不少与之对局的棋手也坚称此观点。当然,现在我们已经知道,“Master”就是AlphaGo的升级版,那个4:1击败过世界冠军的机器人。
整个事件是不是颇有一番武侠小说的味道?“绝世高手化名街头竖子,六十回合扫遍天下豪杰”……60回合,要知道这可不比当年对战李世石的4:1,60场不败,说明AlphaGo确实内力大涨,那么究竟涨在哪里了?
这目前还没有详细的答案,但我们可根据AlphaGo分析一番。AlphaGo背后的核心技术是使用了两种深度学习神经网络,即“策略网络”和“价值网络”。AlphaGo采用“蒙特卡洛树搜索”算法将“策略网络”和“价值网络”综合起来决定走哪一步。
稍微深入一些,其实AI下围棋这件事,本质问题就是从一个19*19的空棋盘开始,每走一步,将当前的棋局看做一个盘面,在这个盘面中,考虑所有合法的落子点,然后从这些点中搜索出最佳的节点,每一个节点带有两个参数:访问次数和质量度。其中质量度和当前落子点可能的获胜概率有关,背后有复杂的算法。
可以想象,从开始到下完,AI会形成一个非常庞大的树状搜索网络,这是AI下围棋和象棋相比难度差异巨大的关键所在。当然,整个网络的宽度(落子的节点数)和深度(一步一步往下走的盘面数)十分庞大,AI在思考的时候不能遍历完全,这就需要“策略网络”和“价值网络”来减少遍历的宽度和深度,只针对最适合的几个节点进行考虑。
▲象棋遍历网络
▲围棋遍历网络
“策略网络”首先通过输入人类棋谱数据进行大量的训练(SL落子策略),不过这个学习更多是孤立的,只针对每一步而言如何模仿人类的走法,而不以赢棋为目的。然后进行强化训练(RL落子策略),自己和自己下棋进一步完善参数,这里就要以胜利为目标了,如果胜利了,那么这个胜利过程中所有落子点都会获得正面的评价。另一方面,“价值网络”主要负责对整体局面的评估,通过判断整体局面的胜率来辅助落子。
在此基础上,结合蒙特卡罗搜索树框架下构成的一个系统,大体上就是的机制。那么Master究竟涨在哪里了,目前还没有更多的消息透露,但从谷歌公告的只言片语可以看出,Master可能完全没学过棋谱,也就是说,Master可能完全是靠自己和自己对局成长起来的,之前说过,这个策略下,Master更多以胜利为目标,可能会出现一些让人开始无法理解的走法,但最终目的是胜利。
IT之家视点:无论Master是否属于谷歌,无论Master实力究竟涨在哪里,这短短时间里人工智能AlphaGo的进步都是令人惊叹的。AI在未来的应用场景细思之下已经可以让人倒吸一口气,值得我们长期关注。但借此开始盲目热炒人工智能也是不可取的,AI完全取代人类的路还很长,与其现在开始炒作,不如认真思考人类应该如何应对AlphaGo们的时代吧。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。