阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型：自由互动，无需输入文本

2024-08-13 12:07IT之家(沛霖（实习）)17评

感谢IT之家网友我抢了台、風見暉一的线索投递！

IT之家 8 月 13 日消息，阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。

作为一个大规模音频语言模型，Qwen2-Audio 能够接受各种音频信号输入，并根据语音指令执行音频分析或直接响应文本，有两种不同的音频交互模式：

官方在一系列基准数据集上进行了测试，Qwen2-Audio 超越了先前的最佳模型。

▲ Qwen2-Audio 整体表现

IT之家附相关链接如下：

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

我国完成备案并上线、能为公众提供服务的生成式 AI 服务大模型达 180 多个

Qwen2-Math 开源 AI 模型发布：阿里通义千问家族新成员，数学能力超 GPT-4o

无一大模型及格！北大 / 通研院提出超难基准 LooGLE，专门评估长文本理解生成

大家都在买广告

热门评论