英特尔公布 Aurora 超级计算机完整规格:21248 个 Xeon CPU 和 63744 个 GPU,性能超 2 ExaFlops
IT之家 5 月 23 日消息,英特尔为美国阿贡国家实验室设计的 Aurora 超级计算机已经推迟了很长时间,但它终于成型了。
值得一提的是,Intel 、 HPE 和 Argonne 正在联手开发一种用于科学计算的大型语言模型,称为 AuroraGPT。它建立在 1 万亿个参数的基础模型上,规模明显大于基于 GPT-3 的 ChatGPT。
该系统由英特尔 Xeon CPU Max 和 Xeon GPU Max 系列芯片提供支持,与最初的 1 Exaflop 目标相比已升级为 2 Exaflop 算力,从而使它与基于 AMD 芯片的 Frontier 超级计算机相提并论(IT之家注:后者是目前地球上已公布的最强超算)。
英特尔透露,Aurora 超级计算机总共 10624 个节点,其中包括基于 Sapphire Rapids-SP 系列的 21,248 个 Xeon CPU 和基于 Ponte Vecchio 设计的 63,744 个 GPU,该系统可提供 2.12 PB/s 的峰值带宽和 0.69 PB/s 的峰值二分带宽。
对于内存,Aurora 超级计算机配备了 10.9 PB 的 DDR5 DRAM、1.36 PB 的 CPU HBM 和 8.16 PB 的 GPU HBM。
也就是说,这套系统 DRAM 达到了 5.95PB/s 的峰值带宽,CPU HBM 可提供 30.5PB/s 的峰值带宽,GPU HBM 则为 208.9PB/s 的峰值带宽。在存储方面,该系统配备了 230 PB 的 DAOS 容量,以 31 TB / s 的峰值带宽运行,总共配置了 1024 个节点。
得益于英特尔数据中心 GPU Max 系列处理器,Aurora 可实现最快的 SimpleFOMP 性能,超过 NVIDIA A100 和 AMD Instinct MI250X 加速器。
此外,英特尔还在聚变反应堆预测、蒙特卡洛方法(最大化)和 QMCPACK(计算量子力学特性)中有着不输加速器的解决方案。
Aurora 超级计算机将在今年晚些时候进行升级,其峰值性能将超过 2 Exaflops。值得一提的是,这台超级计算机还将运行最新的 Aurora gen AI 模型,可提供 1 万亿个参数。
除了 Aurora 超级计算机,英特尔还宣布了其全新的数据中心 GPU Max 子系统,该子系统采用 x8 UBB 设计,共有 8 个 Ponte Vecchio GPU。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。