AMD ROCm 7.2.0 正式发布:支持多款新硬件,优化 Instinct AI 性能

2026-01-26 09:47 IT之家 - 溯波(实习)

IT之家 1 月 26 日消息,AMD 上周正式发布了 ROCm 开源软件堆栈的 7.2.0 版本。这一版本新增了对多款新硬件的正式支持,并优化了 Instinct MI350 系列与 MI300X 显卡加速器的 AI 表现

具体来看,ROCm 现已正式支持 AMD Radeon AI PRO R9600D、Radeon RX 9060 XT LP、Radeon RX 7700 三款独立显卡和最近推出的锐龙 AI 400 系列处理器。

同时,这一版本在 Instinct MI355X 上显著提升了 Meta Llama 3.1 405B 模型的推理表现,通过内核级调优和内存带宽提升实现了吞吐量提升和延迟降低;优化了 Llama 3 70B 和 Llama 2 70B 在 MI355X、MI350X 上的性能;在 MI300X 上优化智谱 GLM-4.6 的 GEMM 算子性能和 DeepSeek 的 DeepEP 开源通信库表现。

ROCm 7.2.0 还包含其它一系列改进,包括提升 HIP 运行时性能、新增对多 GPU 节点的节点电源管理等。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值 还可以 无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消 发送
        分享成功

        长按关注IT之家公众号
        阅读更多精彩文章

        查看更多原创好文
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享