10 分钟 Whisper 模型处理测试:英伟达 RTX 4090 比苹果 M3 Max 慢 86%

2023-12-14 07:07IT之家 - 故渊

IT之家 12 月 14 日消息,开发人员 Oliver Wehrens 近日测试了苹果 M1 Pro、M2 Ultra 和 M3 Max 三款 Apple Silicon 芯片升级 MLX 框架后训练 AI 能力,并对比了英伟达的 RTX 4090 显卡。

Wehrens 使用 OpenAI 的语音识别模型 Whisper 进行测试,主要测量转录 10 分钟音频文件所需时间。

测试结果显示 M1 Pro 处理音频时间需要 216 秒,英伟达 RTX 4090 显卡处理时间需要 186 秒。

而具有 76 个 GPU 的 M2 Ultra 和具有 40 个 GPU 的 M3 Max 处理性能更为优秀,分别为 95 秒和 100 秒。

此外苹果 Apple Silicon 芯片功耗也更为优秀。英伟达 RTX 4090 在运行状态下,比闲置状态下高出 242W。

而配备 M1 Pro 芯片在运行状态下,仅比闲置状态下高出 38W。

IT之家此前报道,MLX 框架特点如下:

  • 熟悉的 API:Python 和 C++ API 具有熟悉的框架,如 NumPy 和 PyTorch,使经验丰富的研究人员易于学习。

  • 轻松高效:MLX 使用可组合的功能转换来优化 Apple Silicon 的性能。

  • 延迟计算:能够防止不必要的计算并提高资源效率。

  • 动态设计:能够适应输入形状变化,简化了调试和测试过程。

  • 软硬结合:MLX 无缝利用苹果设备的 CPU 和 GPU,确保用户能够充分利用硬件。

  • 统一内存优势: MLX 利用苹果统一内存,能够进一步加强数据移动速度

  • 研究人员友好:MLX 专为研究人员设计。

相关阅读:

苹果推出 MLX 深度学习框架:专为 Apple Silicon 优化,可实现“软硬结合”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享