普通话响应速度提升 3 倍,ElevenLabs 发布文本转语音 Turbo 2.5 AI 模型

2024-07-20 10:32IT之家 - 故渊

IT之家 7 月 20 日消息,ElevenLabs 昨日(7 月 19 日)发布博文,介绍推出了全新的 Turbo v2.5 文本到语音 AI 模型,支持普通话等 32 种语言,为全球近 80% 的地区提供高质量、低延迟的 AI 对话。

Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,这些语言的使用人数分别为 8500 万、1300 万和 530 万。

本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍;英语的速度提高了 25%。IT之家附上宣传视频如下:

Turbo v2.5 模型结合了先进的文本到语音技术和最新的低延迟模型架构,用户基本上不需要等待,就能提供高质量的 AI 生成音频输出。

Turbo 模型实现了快速语音合成,同时保持流畅和自然的高品质音质,响应时间不超过 400 毫秒。

ElevenLabs 成立于 2022 年,总部位于伦敦,专注于开发人工智能语音模型和工具,可以创建不同语言、口音和情感的合成语音。

公司首席执行官 Mati Staniszewski 表示,ElevenLabs 目前拥有约 40 名远程办公员工,分布在全球各地,并计划到年底将团队扩大至 100 人。

ElevenLabs 非常重视人工智能内容的透明度,并开发了 AI Speech Classifier 等工具帮助识别合成音频,同时也在开发用于电影配音的工具,并正在开发一个允许用户生成 AI 语音并通过授权赚钱的平台。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享