1.77PB 共享内存创新纪录:谷歌云数据中心已部署 Ironwood TPU,最高可扩展 9216 芯片

2025-09-06 16:02IT之家 - 问舟

IT之家 9 月 6 日消息,在上周的 Hot Chips 2025 大会上,谷歌压轴展示了其最新一代 TPU“Ironwood”,并公布了配套超级计算机的技术细节。

IT之家注:Ironwood 发布于今年 4 月,属于第七代 TPU 硬件。作为谷歌首款专为大规模推理负载设计的 TPU,Ironwood 集成双计算核心,FP8 精度算力达 4,614 TFLOPs,并配备 192GB HBM3e 显存,可提供 7.3TB/s 带宽。

系统架构层面,Ironwood 的 I/O 带宽达 1.2TB/s,单个系统能够扩展至 9,216 枚芯片,整体性能最高可达 42.5 ExaFLOPS。

同时,这一系统实现了 1.77PB 的共享内存,打破了此前共享内存超级计算机的容量纪录。此外,该系统还能在节点故障时重新配置,并通过检查点恢复任务。

Ironwood 具备多项稳定性设计,内置可信根、自检功能及静默数据损坏防护机制。同时配备逻辑修复功能以提升制造良率,全架构贯彻可靠性、可用性与可维护性(RAS)设计理念。散热方案采用谷歌第三代液冷基础设施,并由冷板方案支撑。

谷歌称,该芯片在能效上较前代 Trillium 提升一倍,并支持动态电压与频率调节,以适应不同负载。

据称,Ironwood 在设计阶段已应用 AI 技术优化算术逻辑单元电路及布局规划,新增第四代稀疏核心加速嵌入操作与集合通信,支持推荐引擎等负载。

谷歌表示,目前 Ironwood 已在谷歌云数据中心规模部署,但仍作为内部平台,暂不对外部客户直接开放。

相关阅读:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        分享成功

        长按关注IT之家公众号
        阅读更多精彩文章

        查看更多原创好文
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享