.hd-box .hd-fr

Mistral 推出 Voxtral 系列语音理解模型：以开源形式提供一流正确率表现

2025-07-16 16:53IT之家(溯波（实习）)3评

IT之家 7 月 16 日消息，Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出，可以更低价格提供一流的低错误率表现，支持真实世界的语音智能生产应用。

Voxtral 系列模型由 Mistral Small 3.1 派生而来，包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini，此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

该模型支持 32K Token 的上下文长度，可处理 30 分钟音频转录或 40 分钟音频理解，内置生成相关问题、结构化摘要的能力，支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper，而价格不到后者的一半；而在高级用例方面，Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近，价格也不到一半。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

我国自主研发首套航空运输大模型“天牧”发布，提供管理 / 协作 / 服务三大特性

法国 AI 实验室 Mistral 推出推理模型 Magistral 系列，Small 版已开源

Mistral 发布编程专用开源 AI 模型 Devstral：240 亿参数、单张 RTX 4090 显卡可运行

大家都在买广告

热门评论