.hd-box .hd-fr

开发人员释疑:跟柯洁对战的AlphaGo到底有多强

2017-05-24 11:48IT之家(小侃)0评

IT之家5月24日消息 在中国乌镇举行的围棋峰会已经进入第二天,在今天举行的人工智能高峰论坛上,Deepmind的首席程序员席尔瓦向公众介绍了AlphaGo的强化学习方式,以及相比于去年同李世石对战的AlphaGo Lee,今年同柯洁对战的AlphaGo Master到底强在了哪里。

根据席尔瓦介绍,AlphaGo是通过与自己对弈,进行强化学习,自己吸取经验来改进。策略网络P以预测AlphaGo的移动,价值网络V以预测获胜者。通过这样的方式反复迭代,新策略和价值网络用于AlphaGo的下一个迭代中,新版AlphaGo可以得到更好结果和数据,达成良性循环。

与李世石对战的AlphaGo Lee在谷歌云上有50个TPUs在运作,搜索50个棋步为10000个位置/秒,而昨天打败柯洁的AlphaGo Master是在单个TPU上进行游戏,AlphaGo成为自己的老师,它从自己的搜索里学习,有着更强大的策略和价值网络。

简单来说吧,按照Deepmind团队的预测,与柯洁对战的AlphaGo Master要比去年同李世石对战的AlphaGo Lee强三个子。

在昨天的对战中,柯洁最终是以1/4子的劣势输给谷歌了AlphaGo Master。

对此,柯洁也在微博上感慨“我到底是在和一个怎样可怕的对手下棋...”。

柯洁微博全文如下:

早就听说新版alphago的强大....

但...让...让三个?我的天

这个差距有多大呢?简单的解释一下就是一人一手轮流下的围棋,对手连续让你下三步...又像武林高手对决让你先捅三刀一样...

我到底是在和一个怎样可怕的对手下棋...

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论