.hd-box .hd-fr

重磅!微软揭秘新一代全双工语音交互技术:AI新标配

2018-03-28 20:39IT之家(玄隐)0评

IT之家3月28日消息 在上一周,IT之家报道了微软正式推出新一代全双工语音交互技术的消息,该技术已经在小冰全球产品线中落地。3月28日,微软在北京微软亚太研发集团大楼举办了小冰技术交流会,IT之家作为主流科技媒体受邀参加,一起见证和分享了微软小冰全双工语音交互技术的深度揭秘,以及全新的人工智能基础框架的变革。

此前,微软(亚洲)互联网工程院宣布率先推出新一代的语音交互技术:全双工语音交互感官(Full-duplex Voice Sense),并已完成产品化落地。与既有的单轮或多轮连续语音识别不同,这项新技术可实时预测人类即将说出的内容,实时生成回应并控制对话节奏,从而使长程语音交互成为可能。此外,采用该技术的智能硬件设备,将不再需要用户在每轮交互时都说出唤醒词,仅需一次唤醒,就可以轻松实现连续对话,将语音交互的自然度推进到一个新的层次。比如之前微软和小米旗下米家生态链合作推出的Yeelight语音助手,就是全球首个搭载全双工语音交互感官的智能设备,也是内置微软小冰的首个“双AI”智能设备。

那么微软在小冰上的人工智能核心基础框架有何改变呢?

微软(亚洲)互联网工程院副院长李笛开场就表示,现在对话式人工智能基础框架的理念之争正在发生变化,由之前的Turn-oriented框架 — 面向单个任务,转向基于Session-oriented框架 — 面向整个对话全程的技术变革。特别是微软,已经实现了人工智能基础框架的转变,并且预测这将是人工智能发展的新趋势。

▲微软(亚洲)互联网工程院副院长李笛

微软在小冰技术交流会上表示,目前大多数的智能音箱或智能语音助手采用的是Turn-oriented框架,对话如十字路口,当用户提出问题后会将其引导到特定的场景并最大理想化完成特定任务。而小冰和微软研究发展的Session-oriented框架,对话如河流,在整个过程中既包含任务,也包括一些“无用的”对话,但这些对话中也可能引申出新的任务,并以更加自然交互的方式完成整个对话。

微软强调,基于Turn-oriented的框架因其存在上限,决定了这种内在基础的发展空间难以提高。目前新推出的Session-oriented框架还有很大的上升空间,其中的全双工语音交互感官功能是Session-oriented框架的最后一环,实际结构上是IQ贯穿和基于EQ之上,这也是之前微软大力发展基于情感的人工智能成果表现。

▲微软小冰全球研发负责人、首席架构师周力

在小冰技术交流会上,微软小冰全球研发负责人、首席架构师周力披露了部分技术特征

IT之家报道,微软此前表示,语音交互是对话式人工智能及智能硬件设备的基础之一。全双工语音交互技术的应用,有望实现用户体验的下一次飞跃,并成为人工智能语音交互的新“标准配置”。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论