AMD MI300X 评估:强悍硬件难掩软件短板,难以跨越英伟达“CUDA 护城河”
IT之家 12 月 24 日消息,科技媒体 SemiAnalysis 于 12 月 22 日发布博文,表示经过长达 5 个月的深入调研后,发现 AMD 的新款 MI300X AI 芯片虽硬件强大,但软件问题严重,难以撼动英伟达的市场主导地位。
IT之家注:单从规格上来看,AMD 的 MI300X 芯片更有优势,拥有 1307 TFLOPS(FP16)的算力和 192GB HBM3 内存,而作为对比,英伟达的 H100 为 989 TFLOPS 和 80GB 内存,即使是 H200 也只有 141GB 内存,AMD 系统凭借更低的价格和更经济的以太网络,总体拥有成本更低。
但该媒体在深入调研后发现,AMD 的软件漏洞百出,实际运行过程中需要大量的调试工作,几乎无法展开 AI 模型训练工作。而英伟达持续推出新功能、库和性能更新,不断扩大其领先优势。
该媒体分析师通过 GEMM 基准测试和单节点训练等大量测试,发现 AMD 难以逾越英伟达的“CUDA 护城河”。
AMD 的开箱即用体验非常糟糕,需要投入大量时间和精力才能达到可用状态,甚至连 AMD 最大的 GPU 云提供商 Tensorwave 都不得不向 AMD 团队提供免费的 GPU 访问权限,以便修复软件问题。
SemiAnalysis 建议 AMD CEO 苏姿丰加大软件开发和测试的投入,学习 Nvidia 的做法,分配数千个 MI300X 芯片用于自动化测试,简化复杂的环境变量,并优化默认设置,提升开箱即用体验。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。