国产 GPU 抢站票

要说有什么芯片产品最引数码达人关注,那必然是 GPU。

GPU 是个热闹异常的市场。围绕 GPU / 显卡玩梗也成为数码爱好者茶余饭后的一项乐趣:“超低功耗,极致色彩,曲面细分”“矿卡论斤卖““一卡一栋楼,两卡毁地球,三卡银河系,四卡创世纪”。它曾一度挑战甚至超越同时期的 CPU,它曾让无数游戏玩家为之疯狂,它曾向更深、更广领域延伸触角。[1]

因为国外厂商长期垄断,国内对自主 GPU 的期盼越来越强烈。

在本文中,你将了解到:GPU 和显卡有什么关系,GPU 的国内外市场情况和国产化布局,GPU 及背后的思考。

1、那些容易被混淆的概念

GPU(Graphics Processing Unit,图形处理器)又被称作显示核心、视觉处理器、显示芯片,是一种专为并行处理而设计的微型处理器,非常擅长处理大量简单任务,包括图形和视频渲染。GPU 能应用在台式机、笔记本电脑、工作站、游戏机、嵌入式设备、数据中心等各种需要渲染图形或高性能计算的场景。

在生活中,我们普遍把 GPU 叫成显卡。不过事实上,GPU 和显卡在术语上有细微差别,GPU 指的是负责处理各种任务的那颗芯片,显卡指的是把 GPU 芯片、显存、接口等集合在一起的那张板卡。

GPU 根据接入系统的方式分为集成型 GPU(Integrated GPU,iGPU)和离散型 GPU(Discrete GPU ,dGPU)两种,前者就是我们日常所说的集成显卡 / 核芯显卡,后者就是我们日常所说的独立显卡,两种类型 GPU 均有各自的特点和使用场景。

GPU 的两种分类,制表丨果壳硬科技

集成型 GPU 中,GPU 被嵌在 CPU 旁边,且无单独的内存组用于图形 / 视频,会与 CPU 共享系统内存。由于集成型 GPU 内置于处理器中,通常功耗更低,产生的热量更少,从而延长了电池续航时间。

离散型 GPU 则完全以独立板卡出现,通常被连接在 PCI 高速插槽内,就像主板包含 CPU 一样。离散型 GPU 除包含 GPU 芯片以外,还包括允许 GPU 运行并连接到系统其余部分所需的大量组件。离散型 GPU 有自己的专用内存,同时也拥有自己的内存源和电源,因此其性能比集成型 GPU 更高。但由于与处理器芯片分离,因此会消耗更多功率并产生大量热量。[2][3][4]

2、从专用到通用再到融合

现代的 GPU 拥有两大功能,一是充当强大的图形引擎,二是用作高度并行的可编程处理器,处理各种神经网络或机器学习任务。

图形计算是 GPU 的拿手绝活。当我们拖动鼠标时,GPU 将需要显示的图形内容计算后呈现在屏幕上;当我们打开播放器观看电影时,GPU 将压缩后的视频信息解码为原始数据;当我们玩游戏时,GPU 将游戏画面计算并生成出来。轻点鼠标的背后,是复杂的处理过程,包括顶点读入、顶点渲染、图元装配、光栅化、像素渲染等。[5]

图形 GPU 广泛应用于游戏、图像处理和加密货币等场景,关注图像学的帧数、渲染逼真度、真实场景映射度等参数指标。[6]

对图形 API 定义的流水线实现硬件加速的不同阶段,制表丨果壳硬科技,参考资料丨《计算机体系结构基础》[5]

通用计算是 GPU 并行计算优势的最佳体现。科学家和工程师发现,只要数据以图形形式存在,并将 GPU 基础上增加部分通用计算能力,GPU 就能胜任各种高性能模计算任务,也就是行业所说的通用 GPU(GPGPU,General-Purpose Graphics Processing Unit)。本质上,通用 GPU 还是一种 GPU,不过它会针对高性能计算、AI 开发及许多其他惊人的突破上定制和靠拢,因此所使用的训练集更大、训练时间更短、分类 / 预测 / 推理功率更低、占用基础设施更少。[7]

通用 GPU 主要应用在大规模人工智能计算、数据中心及超算等场景,以支持更大的数据量和并发吞吐量。[6]

两大功能的背后,是一部漫长的发展史。

1962 年,Ivan Sutherland(伊凡・苏泽兰)的论文《SketchPad:图形化人机交流》和他录制的 Sketchpad 操作视频成为定义现代计算机图形学的基础 [8]。之后的 20 年内,受精度和运行强度等限制,彼时的显卡仅仅是将 CPU 计算生成的图形翻译成显示信号,所以只能称作图形适配器(VGA Card)[9]。直到 IBM 在 1984 年推出了 MDA 和 CGA 两款 2D 显卡,才意味着行业产生雏形,虽然放到现在两款产品只能算作是丑小鸭,但却标志着 GPU 开始走向与 CPU 分庭抗礼之路。

上世纪 90 年代,3D 图形加速兴起。历史上第一块真正意义的 3D 图形加速卡 Voodoo 问世后,S3 又推出第一款同时拥有 2D 和 3D 图形处理能力的显卡 S3 Virge[10],此后行业便开始多点开花,逐渐诞生出 NVIDIA 的 NV1、Matrox 的 Mlennium、Mystique、PowerVR 的 PCX1 等优秀产品,一度显现出百家争鸣的盛况。繁华过后,便是残酷的大鱼吞小鱼式并购和行业整合,形成英伟达、AMD 两家独大的格局。自此之后,GPU 也开启了跨越式的迭代之路。

独立显卡发展历史,制表丨果壳硬科技,参考资料丨 IEEE Computer SOCIETY[11],英伟达官网 [12],公开资料

GPU 的通用性,是在迭代中逐渐表露出来的。20 世纪 90 年代到 21 世纪初,为应对更为复杂和大量的图形计算问题,GPU 模式不再为固定图形流水线模式,处于图形流水线中的顶点处理器、几何处理器、像素与子素处理器的可编程性得到增强,表现出通用计算能力。随后,为解决 GPU 片内负载均衡问题,统一渲染处理器(Shader Processor)取代了各种可编程部件,同时流处理器(一种流计算模型上充分考虑并发和通信的计算体系)的应用奠定 GPU 通用计算的基础。[13]

GPU 在可编程性和计算能力上的快速增长,引得大批研究团体关注,争相将大量需要计算的复杂问题映射到 GPU 上,并将 GPU 定位为未来高性能计算机系统中传统微处理器的的替代方案 [14]。英伟达所研发的 Tesla 架构正式标志着 GPU 朝向通用 GPU 发展,为后续在深度学习领域广泛应用奠定了基础。[15]

GPU 从图形显示到通用计算之路 [16]

时间回到现在,GPU 在图形计算上的专用性和面向人工智能的通用性上,引发科学界的争论,是否要将 GPU 的 AI 和 3D 功能拆分成两种 DSA。GPU 专用于图形计算效率高,但只支持几种特定的算法和模型,走通用计算兼容性好,但效率差,功耗也大。[17]

目前行业一致的观点是 GPU 在图形计算和通用计算表现出的“双重人格”会逐步融合,未来将不再拥有功能界限,GPU 也将拥有原生可微和张量加速能力。[18]

那么,再往后呢?从近几年的大会来看,GPU 将向大规模扩展计算能力的高性能计算(GPGPU)、人工智能计算(AI GPU)、更加逼真的图形展现(Ray Tracing GPU,光线追踪 GPU)三大方向发展 [16]。其中 AI 是关键,GPU 硬件 / 软件界面将使 GPU 成为“AI 世界的 CPU”,基于 AI 的渲染会让张量加速成为 GPU 中的主流。[18]

GPU 的两大功能和应用 [16]

3、GPU 与 CPU 的抢婚者

GPU 虽然好用,但它也脱离不开 CPU。一方面,GPU 无法单独工作,需要依赖 CPU 控制调用;另一方面,二者的架构极为不同,构建目的也各有不同。

CPU 会包含 4 个、8 个、16 个甚至 32 个以上的强劲内核,同时一个内核之中便封装了算术逻辑单元(ALU)、浮点处理单元(FPU)、 地址生成单元(AGU)、内存管理单元(MMU)等几乎所有功能。一般来说,CPU 中计算单元 ALU 约为 25%,逻辑控制为 25%,缓存 Cache 为 50%。反观 GPU 中计算单元 ALU 通常达到 95%,缓存 Cache 则为 5%。[19]

最初,GPU 是为了帮助 CPU 加速图形处理而设计的专用硬件。图形渲染具备极强的并行性,需要非常密集的计算与巨大的数据传输带宽,所以 GPU 被设计成包含成千上万个较小内核的形式。每个 GPU 的内核都可以并行执行一些简单的计算,内核本身算不上十分智能,但与“一核有难八核围观”的 CPU 不同,GPU 能同时动用全部内核执行卷积、ReLU 和池化等深度学习计算。除此之外,GPU 采用了灵活的存储层次设计以及两级编程编译模型。[20][21]

GPU 和 CPU 的不同点 [22]

不同的结构设计使得 GPU 有了自己的专长。GPU 的频率只有 CPU 的三分之一,但在每个 clock 周期中,它能够并行执行多于 CPU 将近 100 倍的计算,在大量并行度任务中,GPU 比 CPU 快得多,对那些并行度很低的任务,显现的速度就会慢得多。另外,相比 CPU,GPU 通常拥有 5~10 倍的内存带宽,但在访问数据时会有更长的延迟,这就造成 GPU 在可预测的计算上做得更好,但在不可预测的计算上做得更差。[23]

由此可见,CPU 和 GPU 是互补且不冲突的,前者专注串行运算,后者专注并行运算。打个比方来说,可以将 CPU 理解为博士,不仅知识渊博,诸多问题也钻研得很深,没有他许多难题都没有办法解决。而 GPU 就是上万个初高中生,只会简单的算术,但无论博士有多强大,也不可能在一瞬间计算出上万道简单的算术运算。[24]

CPU 和 GPU 间的不同 [22]

翻开计算简史,诞生了丰富多样的数字芯片,每种数字芯片都有一段沉淀良久的发展史。计算机背后就是计算问题,无外乎标量、矢量、矩阵、空间几种数据类型,GPU 与其他数字芯片难免会产生交集和重合。现在,CPU 依然还是那个 CPU,GPU 却可以不是 GPU 了。

长久以来,GPU 与 FPGA、ASIC 的争议不断,它们可分别构成“CPU+GPU”“CPU+FPGA”“CPU+ASIC”的异构计算系统,同时 FPGA 和 ASIC 厂商时常将自家产品与 GPU 算力平行对比,如 NVIDIA Tesla A100 时常成为“战力计量单位”,CPU 的抢婚者们都在诉说着自己的优势。

理性而言,GPU、FPGA、ASIC 都是配合 CPU 计算的好能手,对厂商还是下游使用者而言,三者的特性截然不同,虽然可能会在部分应用场景下表现出更强的算力或更好的功耗,但部署过程难免要综合考虑 TCO(总拥有成本)、构建难度、系统兼容度等,很难评判孰强孰弱。

不同计算器件的对比,制表丨果壳硬科技

不过,GPU 相对产品成熟,峰值计算能力优异,同时在图形显示的地位无可撼动,顺理成章地搭上半导体热潮,成为市场追捧的宠儿。

数据显示,AI 训练阶段,GPU 约占 64% 市场份额,而 FPGA 和 ASIC 分别占比 22% 和 14%;推理阶段,GPU 约占 42% 市场,而 FPGA 和 ASIC 则分别占比 34% 和 24%。[25]

不同应用场景 AI 芯片性能需求和具体指标 [25]

被国外垄断的格局

GPU 不仅在当下是一门空间广阔的生意,未来更是潜力无限。

根据 Verified Market Research 数据显示,从 2021 年到 2030 年,GPU 将以 33.3% 的年复合成长率,从 330 亿美元成长至 4773 亿美元。[26]

GPU 会按照平台对功耗负载要求不同,制作成各种规格,如手机中 GPU 典型功耗为 5W,笔记本电脑中典型功耗为 150w,台机能够到达 400W,数据中心全力追求性能。根据功耗大小,市场主要划分为桌面级和移动级两种应用。

两个市场均呈现三足鼎立的态势:桌面级 GPU 市场被英伟达、AMD 和英特尔所垄断,移动级 GPU 市场被 Arm、Imagination 和高通所垄断。在软件层面,上述国外公司也对如 CUDA 和 OpenCL 等一系列异构计算标准提供了支持。[27]

桌面级产品方面,面向 PC 或游戏的图形卡占大多数市场,拥有 50% 以上的份额,数据中心。

Jon Peddie Research(JPR)数据显示,2022 年 Q2,PC 使用的 GPU 出货量(包括集成和独立显卡)为 8400 万块,其中英特尔 GPU 市场份额高达 68%,主要归功于英特尔在台式机 / 笔记本电脑 CPU 集成大量核显;AMD 以 17% 份额居于第二,这家公司既有核显也有独显,但核显明显占大头,独显只占整体 PC 市场约 3%;英伟达则主攻独显市场,所以虽然看似只有 15% 市场份额,但基本称霸独显市场。[28]

2022 年 Q2 PC 市场 GPU 供应情况 [28]

英伟达是全球独立 GPU 的绝对领导者。初期,英伟达的重心是 PC 图形处理业务,此后乘着 GPU 通用的热潮,拓展至智能终端、自动驾驶、AI 算法等领域。从 2022 年 Q2 财报来看,英伟达的主营业务包括游戏 GPU、数据中心 GPU、专业视觉设计 GPU、智能驾驶 GPU 以及 OEM 和其他业务,占比依次为 30.5%、56.8%、7.4%、3.3%、2%。[29]

为了更好地应对竞争,英伟达每一代显卡的架构设计变化都非常大。经过统计英伟达每一代架构情况来看,性能提升的核心两要素流处理器(Streaming Multiprocessor,SM)和缓存(Cache)都有较大设计改动,这是为了在芯片有限的面积、功耗下,不断调整各种组件配置比例,通过制程工艺迭代,寻求最优解法。[30]

英伟达架构变化 [30]

英伟达是 GPU 概念的提出者,几乎每一款产品都会引起游戏爱好者、设计者大规模讨论。尤其在 40 系使用了全新 Ada Lovelace 架构,采用 TSMC 4N 定制工艺,着色器能力高达 83TFlops,有效光线追踪计算能力达到 191TFlops,是上一代产品 2.8 倍。另有第四代 Tensor Cores,FP8 张量处理性能高达 1.32PFlops,是上一代的 5 倍。[31]

英伟达 30 系和 40 系显卡汇总,制表丨果壳硬科技

与此同时,英伟达还是数据中心 GPU 的倡导者。不仅在业界最先推出通用 GPU 产品,还在 2006 年发布并行编程模型 CUDA。通用 GPU 与 CUDA 组成的软硬件底座,构成了英伟达引领 AI 计算的根基。[6]

不过,英伟达的这几个月也不好过。受半导体产业需求持续下滑影响,一度出现财报雪崩、股价大跌的情况。而新发布的 40 系显卡也争议满满,导致黄仁勋取消 RTX 4080 12GB 版本。[32]

AMD 的 GPU 以性价比为主要竞争力。在独立 GPU 上,同类产品价格普遍低于英伟达 30% 左右,在集成 GPU 上,其包含核显的 APU 产品比包含核显的英特尔 CPU 更便宜。[33]

核显方面,据 Tom's Hardware 测试数据显示,AMD 锐龙系列的核显在诸多游戏中表现优异。[34]

核心显卡部分性能对比 [34]

独显方面,AMD 一直是英伟达的追赶者,仅从浮点算力来看,与英伟达有一定差距;从性能实际表现来看,与英伟达平分秋色。要说 N 卡(英伟达)和 A 卡(AMD)孰强孰弱,暂且没有任何人能给出定论。[35]

独立显卡部分性能对比 [35]

在大家的认知中,英特尔跟 GPU 似乎完全搭不上边,但实际上它在 GPU 出货量上却是实实在在的老大,得益于其 CPU 在全球 PC 市场占据将近七成(包括移动笔记本、台式机、服务器),其核显也被顺带进入千行百业。

2009 年 Q2~2022 年 Q1 全球 PC 图形处理单元(GPU)出货份额(按供应商划分)[36]

但强如英特尔,也在独立 GPU 上屡次折戟。

英特尔在 GPU 绝对不是新手或是业余选手。这家公司拥有业内最优秀的 GPU 工程师、最好的晶圆厂、别人只能幻想的银行账户和响彻全球的品牌,甚至已经坐拥全球最大的 GPU 销售商的称号,出货量比竞争对手的总和还要多。也许,对其他公司来说,有这样的成就就已经很满足了,但英特尔 20 年来,在独立 GPU 上的屡屡失意让这家公司意难平。[12]

1998 年,英特尔就曾发布过一款产品 Intel i740,这款产品的 3D 性能表现还不错,但在 ATI、英伟达、S3 Graphics 等一众产品中,只能算合格,无奈也只得暂时放弃独显之路。

之后在 2009 年,英特尔并没有放弃独显的梦,计划打造 Larrabee 图形处理器。要知道,当时的 GPU 就是将简单的小计算核心组合起来,而英特尔也刚好手握当年的奔腾一代处理器核心 P54C。将这款在当时已有 20 多年历史的核心集成起来做成显卡听起来容易,但显然 Larrabee 研究项目还是给英特尔带来诸多烦恼,无数次的跳票和研究经费不足的新闻之后,最终计划宣告失败。不过,英特尔在 Larrabee 研究基础上,发展出了众核架构 (MIC) 的 Xeon Phi 协处理器,并被天河 2 号所选用,因此英特尔这次也不算白忙活。[37]

2020 年,英特尔浴火重生,把独立显卡的一切都押注在了新推出的 Xe 架构上。2022 年,英特尔 Arc(锐炫)系列显卡横空出世,移动、桌面、工作站、数据中心全覆盖。这次英特尔能不能成功,还是要看后续的市场反馈。

移动级产品方面的故事就不像桌面级 GPU 那样丰富多彩了,尤其是在手机、平板、可穿戴设备上,GPU 与架构高度绑定,Arm、Imagination、高通 Adreno 等 IP 架构各有拥趸,格局恐难巨变。[38]

从产品上来看,联发科、三星的手机 SoC 所用 GPU IP 大部分来自于 Arm;苹果和高通的 GPU IP 则为自研(苹果的 GPU 较大程度沿袭自 Imagination);紫光展锐的手机 SoC 则使用了 Imagination 的 GPU IP。[39]

智能手机和平板 GPU 基准测试排名 [40]

4、国产 GPU 有什么机会

“英伟达的数据中心 GPU 的价格,贵得惊人,国产还替代不了。”经济观察网此前援引从业者的话表示,英伟达 A100 GPU 售价要三千美金左右,还没有什么替代,并且在今年 6 月,英伟达通知对 A100 80G GPU 芯片涨价 20%。

行业早已苦垄断久矣,近两年,国内掀起 GPU 融资潮,项目一个接一个地融资。

从 2020 年开始,GPU 行业融资总额已超过 200 亿元。仅 2020 年~2021 年,通用 GPU 领域就有近 20 起融资事件发生,这些公司所追求则主要是桌面级的独立显卡市场。据 Verified Market Research 数据显示,2020 年中国大陆的独立 GPU 市场规模为 47.39 亿美元,预计 2027 年将超过 345.57 亿美元。[41]

为什么国内新创企业独爱独立显卡?一方面,集成型 GPU 与 CPU 高度绑定,基本都是 CPU 厂商进行设计生产,如英特尔和 AMD 两家公司的核显,再如国产 CPU 厂商龙芯 7A2000 内部集成的自研 GPU[42];另一方面,独立显卡属高性能器件赛道,不仅技术领先于集成显卡,而且应用面更宽,反观集成显卡大多是作为亮机卡或低负荷的日常卡使用。

目前来看,获融的初创公司如芯瞳半导体、芯动科技、摩尔线程、天数智芯、壁仞科技均已陆续推出产品,甚至已进入一些整机,龙芯中科、海光信息、寒武纪、芯原股份几家上市公司也持续耕耘 GPU 业务(包括集显和独显)。

但总体来看,国产 GPU 产品仍处在起步阶段,缺乏应用场景,产品性能与英伟达、AMD 产品有一定差距,软件和生态较难竞争。虽然优势并不明显,但在国际间不可抗力因素驱使下,国内不得不考虑国产平替问题。

国内 GPU 融资上市情况,制表丨果壳硬科技,参考资料丨《科创板日报》[43]、首创股份 [44]

为什么 GPU 会如此吸金?因为 GPU 真的很难设计和制造,它与 CPU 并称两大最难芯片。行业人士一致认为,造 GPU 比造 CPU 还难,对运算性能、安全性、稳定性要求极高,要复杂完整的系统设计,才可能完成。[45]

国产 GPU 还有哪些困境和机遇?果壳硬科技团队认为:

先确定做什么

实际上,GPU 在不同应用场景,也有不同的要求,选好切入点至关重要。目前来说,主要包括 AI 人工智能、FP 双精度浮点运算和图形渲染三类产品,其中图形渲染最难。[46]

另外,还要考虑算力成本。在如今动不动几纳米的制程工艺下,半导体生产必然存在良率问题,很难做到分毫不差。考虑到纳米制程越小代工难度越大,全部都追求最好最稳定并不现实,同时最终成本也会反映在消费端,想立足市场就要考虑算力成本,为不同需求的客户提供多种可选项。[47]

英伟达以刀法精准著称。其 GPU 会在生产初始阶段,扫描流处理器坏区并将这些电路关闭,根据坏区多少分为三六九等,质量高且稳定的核心便是价格更高的数据中心处理器,质量不错但相对次之的便分别出货给 4090、4080[30]。这样的好处是既能做到数据中心、工作站、个人计算机的低中高端全覆盖,又能给不同需求的提供不同的成本选项。

英特尔、AMD、英伟达官网显示,三家的产品不仅价格档位分类清晰,也覆盖诸多场景。反观国内 GPU 厂商,也主要分为数据中心 GPU 和消费级 GPU 两个档位,但起步阶段尚不能覆盖全部场景。

比 CPU 更难

为什么国产难以攻破 GPU?

首先,GPU 专利壁垒极高,专利全球布局重心在美国,国际巨头可以通过规模效应分摊研发成本,不断在专利上埋雷,限制竞争对手发展。

其次,由于 GPU 没有控制器,需要依赖 CPU 控制调用,无法单独工作,因此国产 GPU 必须与国产 CPU 同频共振。

从技术实现难度来看,GPU 是一种比 CPU 还要难开发的芯片,国内缺乏领军人物和工程师,一个经验丰富的工程师至少要在大厂锻炼 10 年以上。从目前国产企业情况来看,创始团队基本均有英伟达、AMD 的工作经验。[25]

除此之外,软件生态也是 GPU 的另一个门槛,软件决定了 GPU 生态的能力上限,也是充分释放硬件能力的必要条件 [47]。英特尔也有类似的观点,他们表示基于 GPU 构建的软件生态,将为不同负载开发芯片提供解决之道,考虑到高性能计算、人工智能和游戏等诸多领域需求,软件生态需要以高度协同的方式不断演进。[47]

芯片可编程性不是决定性因素

《中国科学》一篇论文中指出 [48],有人将芯片可编程性当作芯片普及的重要指标,并表示不容易编程的芯片就不会在市场上取得成功。判断逻辑就是简单的“编程性不好 = 不好用 = 用的人少 = 市场小 = 失败”。

实际上,DSP 也好、NPU 也好、还是以 CUDA 为代表的 GPU 等处理器芯片,在编程上都是有具有门槛的,但这并不妨碍它们拥有每年数千万颗的出货量和数百亿美金的市场容量。

编程本来就是专业人士才要考虑的问题,对 GPU 来说,编程的难易程度不会直接影响市场需求的规模,性能、功耗、性价比才是拿下市场的关键。

消费电子需求下行影响

半导体行业在近期已进入第十七次下行阶段,市场对 GPU 需求走弱,英伟达、AMD 独立 GPU 均受到较大波及。

除此之外,GPU 在此前之所以出现价格疯涨和缺货漩涡,一方面,是线上办公模式的兴起,另一方面,是它不务正业的应用,挖矿。反观现在发展态势,线上办公红利期早已结束,加之加密货币乱象已终止,AMD 也在财报中坦言其独立 GPU 业务受挖矿影响较大。

按照这种逻辑来看,国产 GPU 大多数量产时间均处于下行周期内,且缺乏大规模应用契机,将会迎接不小的市场考验。

何解?

一种解法是剑走偏锋,逆向投资。果壳硬科技曾在历史文章《半导体跑步进入大过剩时代》中提到,半导体行业存在逆向投资的策略。如三星半导体三次在全球半导体市场走弱的情况下逆向投资,扩大产能,击败美国、日本、欧洲玩家,在 DRAM 芯片市场拿下超 40% 份额,稳坐头把交椅。

另一种解法是抓住现有空间,撑到市场反涨。现如今,算力成为重要生产力,每 12 个月便会增长一倍,同时每投入 1 元在算力上,就能带动 3~4 元的 GDP 经济增长,因此才会有东数西算这种重要策略。国产需要抓住现有机遇,期待下一个半导体上行周期。[49]

国产 GPU 需要更多时间沉淀

与此同时,国内 GPU 也存在一些有趣的现象。

科工力量曾指出,为了在宣传中超越英伟达,国产 GPU 存在田忌赛马式比拼,如某款标榜超越国际旗舰级算力的 GPU,却不支持双精度浮点运算,只能用于人工智能方向。[50]

问芯 Voice 指出,号称国产 GPU 有名不副实的情况,一种是内建 AI 加速器来跑个别性能指标的分数,并以此宣传超过英伟达,但实际上 AI 应用覆盖的是千行百业,不可能只为了跑一两个性能指标,一颗好芯片的关键是通用性 [51];另一种是使用第三方的 GPU IP 授权,并宣称是自研自主可控。[52]

事实上,半导体行业从来都不是浮躁心态的短线交易,而是一个需要长期技术沉淀与大鱼吞小鱼式洗牌的过程。对于难度极高的 GPU,国产更需平心静气,超越英伟达并非一两日的易事。

References:

  • [1] 京东云开发者:分享 | 现代企业中的 GPU 计算.2019.3.14.https://mp.weixin.qq.com/ s/0Uh0uGLSvUKiAv8lj2i7pg

  • [2] Intel:What Is a GPU?.https://www.intel.cn/content/www/cn/zh/products/docs/processors/what-is-a-gpu.html

  • [3] Intel:What Is the Difference Between Integrated Graphics and Discrete Graphics?.2021.7.7.https://www.intel.cn/content/www/cn/zh/support/articles/000057824/graphics.html

  • [4] Gigabyte.https://www.gigabyte.com/Glossary/gpu

  • [5] 胡伟武,汪文祥,苏孟豪,张福新,王焕东,章隆兵,肖俊华,刘苏,陈新科,吴瑞阳,李晓钰,高燕萍.计算机体系结构基础 [M].机械工业出版社.2022 年 1 月第 3 版.https://www.loongson.cn/ pdf / computer.pdf

  • [6] 《中国电子报》:高端 GPU 芯片:英伟达的独角戏?.2022.9.19.https://mp.weixin.qq.com/ s / JvexnFXvtXlppkWfTvZGbA

  • [7] 郭亮,吴美希,王峰,等.数据中心算力评估: 现状与机遇 [J]. 信息通信技术与政策,2021, 47 (2): 79.

  • [8] Sutherland I E. Sketchpad (1962):“A Man-Machine Graphical Communication System”. Phil. Diss[J]. 1962.

  • [9] 《中国计算机学报》:综述:显卡 25 年历史变迁.2010.6.9.https://it.sohu.com/ 20100609 / n272680735.shtml

  • [10] 《计算机学报》:综述:显卡 25 年历史变迁.2010.6.9

  • [11] 英伟达:NVIDIA 历史.https://www.nvidia.cn/ about-nvidia / corporate-timeline/

  • [12] IEEE Computer SOCIETY:Famous Graphics Chips: Intel’s GPU History.https://www.computer.org/publications/tech-news/chasing-pixels/intels-gpu-history

  • [13] 王海峰,陈庆奎.图形处理器通用计算关键技术研究综述 [J]. 计算机学报,2013, 36 (4): 757-772.http://cjc.ict.ac.cn/ quanwenjiansuo / 2013-4 / whf.pdf

  • [14] Owens J D, Houston M, Luebke D, et al. GPU computing[J]. Proceedings of the IEEE, 2008, 96(5): 879-899.

  • [15] 鄢贵海,卢文岩,李晓维,等.专用处理器比较分析 [J]. 中国科学: 信息科学,2022.http://scis.scichina.com/ cn / 2022 / SSI-2021-0274.pdf

  • [16] 熊庭刚. GPU 的发展历程、未来趋势及研制实践 [J].微纳电子与智能制造,2020, 2 (2): 36-40.

  • [17] 半导体行业观察:GPU 市场的转折.2022.8.15.https://mp.weixin.qq.com/ s/72eiCjK5qz-DHHYDf53S9w

  • [18] CP Lu, PhD:Will The GPU Star in A New Golden Age of Computer Architecture?.2021.7.22.https://medium.com/m/global-identity?redirectUrl=https%3A%2F%2Ftowardsdatascience.com%2Fwill-the-gpu-star-in-a-new-golden-age-of-computer-architecture-3fa3e044e313

  • [19] 万雪佼,徐步陆.图形处理器 (GPU) 专利态势研究 [J]. 集成电路应用,2017, 34 (07): 6-9.

  • [20] MATLAB:https://mp.weixin.qq.com/s/J3tEZH1hHoJpoBlNshjn9w

  • [21] 马安国,成玉,唐遇星,等. GPU 异构系统中的存储层次和负载均衡策略研究 [J]. 国防科技大学学报,2009, 5.http://journal.nudt.edu.cn/ publish_article / 2009/5/200905008.pdf

  • [22] NVIDIA:What’s the Difference Between a CPU and a GPU?.2009.12.16.https://blogs.nvidia.com/blog/2009/12/16/whats-the-difference-between-a-cpu-and-a-gpu/

  • [23] Thompson N C, Spanuth S. The decline of computers as a general purpose technology[J]. Communications of the ACM, 2021, 64(3): 64-72.https://doi.org/10.1145/3430936

  • [24] Imagination Tech:通俗易懂告诉你 CPU / GPU 是什么?.2017.10.31.https://mp.weixin.qq.com/ s / l9KCh_WstDDiIpKo0pzdaA

  • [25] 智东西:GPU 深度报告,三大巨头,十四个国内玩家一文看懂【附下载】| 智东西内参.2021.3.14.https://mp.weixin.qq.com/ s / tvwt8R02dc4TFUQHeyyAvA

  • [26] Verified Market Research.Graphic Processing Unit (GPU) Market Size And Forecast.2022.4.https://www.verifiedmarketresearch.com/product/graphic-processing-unit-gpu-market/

  • [27] 高胜寒,熊庭刚. OpenCL 在国产 GPU 上的实现 [J]. 舰船电子工程,2021, 41 (9): 113-116,125.

  • [28] Jon Peddie Research:Q2’22 saw a significant decline in GPU and PC shipments quarter to quarter.2022.8.30.https://www.jonpeddie.com/press-releases/q222-saw-a-significant-decline-in-gpu-and-pc-shipments-quarter-to-quarter-a

  • [29] 英伟达 2022 年 Q2 财报.https://www.sec.gov/ ix?doc=/Archives/ edgar / data / 0001045810/000104581022000147 / nvda-20220731.htm

  • [30] Twisted:Nvidia 显卡架构详解.2022.4.9.https://www.twisted-meadows.com/ nvidia-gpu-architecture/

  • [31] 英伟达 GeForce:NVIDIA 实现性能巨大飞跃,GeForce RTX 40 系列开创神经网络渲染新时代.2022.9.21.https://mp.weixin.qq.com/ s / Sc5uL3i2PolxXKhVhpdtxg

  • [32] VideoCardz:NVIDIA scraps RTX 4080 12GB.https://videocardz.com/newz/nvidia-cancels-geforce-rtx-4080-12gb

  • [33] 首创证券:GPU 国产化步伐加速,新兴团队不断涌现.2022.8.1.https://pdf.dfcfw.com/ pdf / H3_AP202208021576791297_1.pdf?1659427369000.pdf

  • [34] Tom's Hardware:

  • CPU Benchmarks and Hierarchy 2022: Processor Ranking Charts.2022.10.16.

  • https://www.tomshardware.com/reviews/cpu-hierarchy,4312.html#section-integrated-gpu-gaming-cpu-benchmarks-rankings-2022

  • [35] Tom's Hardware:GPU Benchmarks and Hierarchy 2022: Graphics Cards Ranked.2022.10.16.https://www.tomshardware.com/reviews/gpu-hierarchy,4388.html

  • [36] Statista:PC graphics processing unit (GPU) shipment share worldwide from 2nd quarter 2009 to 1st quarter 2022, by vendor.2022.5.https://www.statista.com/statistics/754557/worldwide-gpu-shipments-market-share-by-vendor/

  • [37] 科技新知:72 核心 288 线程,英特尔这个怪物是怎么来的?.https://mp.weixin.qq.com/ s / otQQpf6deW2T74tr-TdCEg

  • [38] 集微网:核芯突破!国产 GPU 的机会窗口和生态打法.2021.5.17.https://mp.weixin.qq.com/ s / lxCzkA45PE4QFZZ4NKbMYw

  • [39] 国际电子商情:从跑分看手机 GPU 这两年的发展,iPhone 还独占鳌头吗?.2021.12.18.https://mp.weixin.qq.com/ s / DtlJTNynQ9-aZJ3oVrKLEg

  • [40] Note Book Check:Smartphone and Tablet Graphics Cards - Benchmark List and Comparison.https://www.notebookcheck.net/Smartphone-Graphics-Cards-Benchmark-List.149363.0.html

  • [41] 《中国科学报》:摘取“皇冠上的明珠”,国产高性能 GPU 在路上.2022.9.5.https://news.sciencenet.cn/ sbhtmlnews / 2022/9/371092.shtm

  • [42] 龙芯中科:新一代龙芯 3 号系列处理器配套桥片 7A2000 正式发布,内部集成自研 GPU.2022.7.19.https://mp.weixin.qq.com/ s / A05j9en7Ye5O7_L6Bcps9A

  • [43] 《科创板日报》:GPU 被推至聚光灯下:行业研发壁垒高筑 一图纵览本土产业链“孤勇者”.2022.9.1.https://mp.weixin.qq.com/ s / g6_1JYZBXnY9voonFSWklw

  • [44] 首创证券:GPU 国产化步伐加速,新兴团队不断涌现.2022.8.1.https://pdf.dfcfw.com/ pdf / H3_AP202208021576791297_1.pdf?1659427369000.pdf

  • [45] 真格基金:沐曦彭莉:在不凡“芯”路上解极致难题|真格科技故事 https://mp.weixin.qq.com/ s / WrI04AqWbUvAEfYS7KGLjQ

  • [46] 电子发烧友网:GPU 难以超越 CUDA 生态?国产 GPU 厂商:干就对了!.2022.1.29.https://mp.weixin.qq.com/ s / HBxGCl1UpUpCVEY9jTiX7g

  • [47] 《中国电子报》:高端 GPU 的现实与曙光.2022.9.16.http://m.cena.com.cn/ semi / 20220916/117621.html

  • [48] 鄢贵海,卢文岩,李晓维,等.专用处理器比较分析 [J]. 中国科学: 信息科学,2022.http://scis.scichina.com/ cn / 2022 / SSI-2021-0274.pdf

  • [49] 李正茂,王桂荣.论算力时代的三定律 [J]. 电信科学,38 (6): 13-17.http://www.infocomm-journal.com/ dxkx / article / 2022/1000-0801/1000-0801-38-6-00013.shtml

  • [50] 科工力量:高端 GPU 断供,中国顶级超算根本不怕.2022.9.2.https://mp.weixin.qq.com/ s / wDGZp4NQSVP6RFZk6H-0zA

  • [51] 问芯 Voice:天数智芯推出 DeepSpark 通用开发平台,国产 GPU 不能“迷恋”少数性能指标胜出.2022.8.31.https://mp.weixin.qq.com/ s / CYinRjsYqicOpHR9AFNgFg

  • [52] 问芯 Voice:独家对话 | 国产 GPU 不能挂羊头卖狗肉,应坚持自主通用 | 天数智芯 CTO 吕坚平.2022.7.27.https://mp.weixin.qq.com/ s / HvuTwy9O8hvULdRGo37OYw

本文来自微信公众号:果壳硬科技 (ID:guokr233),作者:付斌,编辑:李拓

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享