微软人工智能语音技术支持 “多情感程度”调节,细腻演绎 “人声”

2021-04-12 16:26IT之家 - 玄隐

IT之家4月12日消息 近期,微软发布最新语音技术,支持 “情感程度”轻松调节,令智能语音的情感表现力更加细腻可控。

人类的情感很大程度上体现于语音语调的微妙变化,比如一句 “再见”,有时是平静而含蓄的,有时是开心而轻松的,有时却是决绝而愤怒的。微软智能语音能够把开心(Cheerful)、悲伤(Sad)、愤怒(Angry)、 恐惧(Fearful)、 不满(Disgruntled)、 严厉(Serious)、撒娇(Affectionate)、温柔(Gentle)、沮丧(Depressed)、尴尬(Embarrassed)、平静(Calm)等情感,以百分之一作为一个量化单元,以平静语气为零点,让虚拟人物即刻拥有成千上万的情感,让内容创作更加有血有肉。IT之家获悉,微软人工智能中文语音如晓晓、云希、云野、晓涵、晓萱、晓墨、晓睿均支持 “情感程度”调节技术,他们年龄、性别、性格各异。

智能语音情感程度可调节演示视频:

微软智能语音情感调节以自适应神经网络为基础,开发者可以使用 SSML 标签(语音合成标记语言),轻松控制情感程度。同时,没有任何编程或 SSML 标签经验的大众用户也可以通过有声内容创作平台使用这一功能。

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis"
       xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="zh-CN">
    <voice name="zh-CN-XiaoxiaoNeural">
        <mstts:express-as style="sad" styledegree="2">
            快走吧,路上一定要注意安全,早去早回。
        </mstts:express-as>
    </voice>
</speak>

面向开发者:微软智能语音情感程度可调节技术情感程度调节示例 1

面向广大用户:微软智能语音情感程度可调节技术情感程度调节示例 2

此外,通过与自动文本情感分析技术相结合,微软智能语音技术可自动预测情感类别,智能演绎饱含情绪变化的作品。

微软智能语音情感程度可调节技术,让音频创作就像导演选角一样,用最适合的声音、最恰当的情感,演绎更出色的作品,适用于聊天机器人、有声书朗读、影视自动配音、游戏等多情景。

AI 有声内容创作工具 : https://speech.microsoft.com/audiocontentcreation

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享