谷歌DeepMind识别算法新突破:一眼“看清”物体

2016-11-04 16:33网易科技 - 乐邦

11月4日消息,据国外媒体报道,算法往往需要数千个例子才能学到某样东西,不过谷歌的研究人员找到了这一问题的解决方案。

大多数人看过一两次某样物体就能将它认出来,而驱动计算机视觉和语音识别的算法则需要成千上万的例子才能够熟知某个新图像或者新词语。

谷歌DeepMind的研究人员如今有了解决这一问题的办法。他们对深度学习算法进行了一些巧妙的调整,使得它根据单一的样本就能够识别图像中的物体和其它东西——这一过程被称作“一次性学习”。该团队在一个很大的已标记图像数据库、手稿和语言上演示了该项技术。

最好的那些算法能够有效地识别物体,但由于其对数据的巨大需求,它们的开发相当耗时,且成本高昂。举例来说,被训练来识别路上汽车的算法需要消化成千上万的例子才能够可信赖地应用于无人驾驶汽车。而收集如此之多的数据往往不切实际——例如,需要在一间陌生的屋子里穿行作业的机器人,可不能花大量的时间去周围溜达学习。

谷歌DeepMind研究科学家奥里奥尔·温亚尔斯(Oriol Vinyals)给深度学习系统加入了一个记忆组件。深度学习系统是一种大型神经网络,经过训练,通过调整很多的类似于大脑神经元的互联组件层的敏感度,它能够识别物体。这种系统需要看大量的图像来调整这些虚拟神经元之间的连接。

该团队在名为ImageNet的带标签照片数据库上展示了该系统的功能。该软件还需要分析数百种图像,但在那之后,它仅依据一张照片就能够识别出新物体——比如小狗。它能够学会识别图像中的独特之处。该算法在仅仅看了一个例子后识别小狗图像的准确率,接近于数据需求巨大的传统系统。

温亚尔斯表示,要是该算法能够快速理解新词的意思,那该项研究会尤其有用。他指出,这对于谷歌而言可能意义重大,因为它可以让系统快速学习新搜索词的意思。

其他的研究人员也开发了一次性学习系统,但它们通常都不兼容深度学习系统。去年有个学术项目利用概率性编程技术实现了这种非常高效的学习。

不过,深度学习系统正变得更加强大,尤其是在加入记忆机制之后。谷歌DeepMind的另一个研究团队最近开发了一种带有弹性记忆的网络,该网络能够执行简单的推理任务——例如,在分析数个简单得多的网络图后,知道如何穿梭地铁系统。

“我认为这是一种非常有趣的方法,带来了在如此庞大的数据集上进行一次性学习的新颖方式。”韩国高级科学技术研究所大脑与机器智能实验室主管Sang Wan Lee表示,“这是一项对人工智能社区的技术贡献,计算机视觉研究人员可能会非常感激它的出现。”

有的研究人员则对该类技术的有用性表示质疑,称它与人类学习还是存在很大的差异。哈佛大学大脑科学系助理教授萨姆·格什曼(Sam Gershman)指出,人类通常是通过理解组成图像的组件来学习的,这需要某种常识或者知识。例如,Segway平衡车看上去或许跟自行车和摩托车很不一样,但它可以由同样的部件组成。”

在格什曼和Sang Wan Lee看来,机器的学习能力要跟上人类还需要一定的时日。“我们还远未能够揭开人类进行一次性学习的奥秘,但该提案显然揭示了一些值得进一步研究的新挑战。”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享