美五大科技公司语音识别被指存偏见:黑人误识率比白人高

2020-03-24 19:57新浪科技 - 李明

北京时间3月24日晚间消息,据国外媒体报道,斯坦福大学的一项研究显示,亚马逊、苹果、谷歌、IBM和微软的语音识别系统存在种族差异,对白人和黑人语音的识别率有高有低。

这项研究发表在《美国科学院院报》(PNAS)上,研究显示,来自世界五大科技公司亚马逊、苹果、谷歌、IBM和微软的语音识别系统,在白人用户中出现的错误,要比在黑人用户中少得多。

研究显示,这五大科技公司的语音识别系统在白人中错误识别单词的可能性约为19%。而在黑人用户中,错误率跃升至35%。此外,大约2%的白人音频片段被这些系统认为是不可读的。而在黑人用户中,这一比例却高达20%。

这项研究采用了一种异常全面的方法来衡量语音识别系统中的偏差,其结果为人工智能(AI)技术的研发敲响了警钟。当前,AI技术正快速融入人们的日常生活中。

在此之前,已有其他一些研究表明,随着面部识别系统被警察部门和其他政府机构所采用,在试图识别女性和有色人种时,它们的准确性会大大降低。另有测试表明,“聊天机器人”、翻译服务,以及其他旨在处理和模仿书面和口头语言的系统中,都存在性别歧视和种族主义行为。

对此,纽约大学统计学教授拉维·史洛夫(Ravi Shroff)称:“我不明白,在这些技术发布之前,这些公司为什么没有进行更多的尽职调查。我不明白,为什么这些问题总是会出现。”

这项研究表明,领先的语音识别系统也可能存在缺陷,因为这些公司在培训技术时,使用的数据并没有尽可能的多样化。这些系统的任务主要是从白人那里学习,而黑人参与相对较少。

参与这项研究的斯坦福大学研究人员约翰·里克福德(John Rickford)称:“这五家公司可能是最大的语音识别技术公司,但他们都在犯同样的错误。我们原以为,这些公司很好地代表了所有种族,但事实却并非如此。”

马萨诸塞大学阿默斯特(Amherst)分校教授布伦丹·奥康纳(Brendan O‘Connor)认为,这些公司在收集数据时也存在困难,另外动力也不足。因为这些公司可能面临“先有鸡还是先有蛋”的问题。

如果他们的服务主要由白人使用,他们将难以收集可以为黑人服务的数据。如果他们在收集数据时遇到这样的困难,这些服务将继续主要由白人使用。但不管怎样,华盛顿大学教授诺亚·史密斯(Noah Smith)都认为,这是一个令人担忧的问题。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享