45 秒 AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄,比 OpenAI Whisper 快 55%

2025-06-18 10:27IT之家 - 故渊

IT之家 6 月 18 日消息,科技媒体 macstories 昨日(6 月 17 日)发布博文,通过一段长达 34 分钟,7GB 的视频文件实测,发现苹果全新的 Speech API 仅用 45 秒完成,比 OpenAI Whisper(101 秒)快 55%。

IT之家注:苹果公司在 WWDC 2025 全球开发者大会上,宣布推出全新的 Speech 框架,其中包含 SpeechAnalyzer 和 SpeechTranscriber 两款模组。

该媒体实测了基于上述模组开发的 Yap 应用工具,发现转录处理一段 34 分钟、7GB 的 4K 视频,只需要 45 秒,远超竞品 MacWhisper(基于 OpenAI 的 Whisper 开源语音转录模型)的 1 分 41 秒。

该媒体进一步对比 Yap 与 MacWhisper、VidCap 等主流工具的表现:

  • Yap:45 秒完成转录,输出 SRT 及 TXT 格式文件;

  • MacWhisper(V3 Turbo):1 分 41 秒;

  • VidCap:1 分 55 秒;

  • MacWhisper(V2):3 分 55 秒。

该媒体指出尽管所有工具在专有名词识别(如“AppStories”)存在误差,但 Yap 的本地化运算,让其速度优势显著,以每周处理多段视频计算,累计节省时间效益可观。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享