.hd-box .hd-fr

阶跃星辰发布端到端语音大模型 Step-Audio 2 mini,多个基准测试取得 SOTA 成绩

2025-09-01 14:55IT之家(浩渺)0评

IT之家 9 月 1 日消息,阶跃星辰今日发布开源端到端语音大模型 Step-Audio 2 mini,该模型在多个国际基准测试集上取得 SOTA 成绩。Step-Audio 2 mini 现已上线阶跃星辰开放平台

IT之家从官方介绍获悉,它将语音理解、音频推理与生成统一建模,并率先支持语音原生的 Tool Calling 能力,可实现联网搜索等操作

Step-Audio 2 mini 在多个关键基准测试中取得 SOTA 成绩,在音频理解、语音识别、翻译和对话场景中表现突出,综合性能超越 Qwen-Omni 、Kimi-Audio 在内的所有开源端到端语音模型,并在大部分任务上超越 GPT-4o Audio。

过往的 AI 语音常被吐槽智商、情商双低。一是“没知识”,缺乏文本大模型一样的知识储备和推理能力;二是“冷冰冰”,听不懂潜台词,语气、情绪、笑声这些“弦外之音”。Step-Audio 2 mini 通过创新架构设计,有效解决了此前语音模型存在的问题。

▲ Step-Audio 2 mini 模型架构图

GitHub:https://github.com/stepfun-ai/Step-Audio2

Hugging Face:https://huggingface.co/stepfun-ai/Step-Audio-2-mini

ModelScope:https://www.modelscope.cn/models/stepfun-ai/Step-Audio-2-mini

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论