AI 训练性能提高 2.5 倍,三星使用 96 张改造的 AMD Instinct MI100 GPU 打造大型计算系统

2022-12-15 14:24IT之家 - 故渊

IT之家 12 月 15 日消息,三星使用内置 PIM(processing-in-memory)的显卡,打造出了全球首个大型计算系统。援引 Business Korea 报道,通过使用 96 张经过 PIM 改造的 AMD Instinct MI100 GPU,将 AI 训练性能提高了 2.5 倍。

PIM 是新型计算机内存,可以加速 CPU 和 GPU 等处理器的处理能力。PIM 最大的特点是每个内存模块都能够自行处理数据,从而减少在内存和处理器之间传输所需的数据量。

三星曾在今年 10 月公开展示过经过 PIM 改造的 GPU,而现在该公司将 96 张经过 PIM 改造的 GPU 放在集群中。与普通显存相比,这些经过改进的 MI100 芯片不仅性能提高了 2.5 倍,而且功耗降低了 2.67 倍,大大提高了 GPU 在运行 AI 算法时的效率。

三星开发 PIM 已有一段时间了。该公司在 2021 年演示了多种实现,涉及多种不同的内存类型,包括 DDR4、LPDDR5X、GDDR6 和 HBM2。在 LPDDR5 形式中,三星在涉及 Meta AI 工作负载的测试程序中看到性能提高了 1.8 倍,功耗降低了 42.6%,延迟降低了 70%。

IT之家了解到,AMD Instinct MI100 加速器经过全新设计,全面迎接计算新时代。1 MI100 加速器采用 AMD CDNA 架构,在计算和互连性能方面实现了巨大的飞跃,与上一代 AMD 加速器相比,高性能计算(FP32 矩阵)性能提升近 3.5 倍,而人工智能 (FP16) 性能则提升近 7 倍。

三星并不是唯一一家开发 PIM 芯片的公司 ——SK 海力士今年早些时候发布了自己的 PIM 模块。根据 SK 海力士的初步测试,其 GDDR6-AiM(内存加速器)应用程序可将 AI 处理速度提高 16 倍,并将功耗降低 80%。这比三星修改后的 MI100s 快很多,但我们不知道 SK hynix 使用什么工具进行测试,因此不能直接比较。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享