发布前已出货 20 万颗,英特尔 40 核第三代至强 CPU 对阵 64 核 AMD 最新 EPYC

大数据对计算和存储性能更高的要求,引发了高性能 CPU 市场的新一轮争夺战。x86 架构是在这一市场拥有优势,但英特尔和 AMD 的竞争正在加剧。另外,Arm 阵营近年来在服务器市场发起猛烈攻势,新兴的 RISC-V 也不想错过这一利润丰厚且潜力巨大的市场。

今天,英特尔正式发布第三代至强可扩展处理器(代号:Ice Lake)及一系列相关产品组合,开启了 x86 阵营英特尔和 AMD 第三代高性能 CPU 新一轮的争夺战。

核心数最高为 40 核的 10nm 第三代至强处理器对战三月中旬 AMD 发布的最高 64 核 7nm 第三代 EPYC(霄龙)CPU,谁更有优势?正式发布前就已经出货 20 万颗第三代至强 CPU 的英特尔,能否压制 AMD 在 CPU 市场的上升势头?

第三代至强平均性能提升 46%

自 2017 年英特尔发布首款至强可扩展处理器,英特尔至今已经交付了超过 5000 万颗至强处理器,部署了超过 10 亿个至强核心,有超过 800 个云服务提供商部署了基于英特尔至强 CPU 的服务器。

这是值得骄傲的成绩,但市场的竞争也足以让英特尔保持警惕。市场分析公司 Mercury Research 指出,截至 2020 年第三季度,AMD 在客户计算芯片市场的份额已经连续 12 个季度增加。IDC 分析师 Shane Rau 指出,2020 年第四季度,AMD 在服务器 CPU 市场的单位占有率为 7.7%,营收占有率为 8.7%。

英特尔公司副总裁兼至强处理器与存储事业部总经理 Lisa Spelman 在新品发布会上表示:“我们没有把至强称作一个服务器产品,它是一个数据中心产品。”

无论定位如何,处理器的升级最为直观的就是性能提升。据悉,第三代至强可扩展处理器采用英特尔 10nm 工艺,最多有 40 个核心,IPC 相比上一代 20 核 Cascade Lake 有 20% 的提升,AI 性能相比上一代提升 74%,总体性能相比上一代平均提升 46%,相比第一代产品平均提升 2.65 倍。

“我们一直努力保守核心数这一秘密,但在发布前还是泄漏了。”Lisa Spelman 表示。

核心数虽然是被迫减少,但 Lisa 对最新至强处理器的其它特性显然非常乐于分享,她特别介绍了三个特性。

首先,第三代至强可扩展处理器是英特尔的第一个主流双插槽并启用 SGX 英特尔软件防护扩展技术的数据中心处理器。

据了解,SGX 已经上市好几年了,但是这是第一次应用到至强 E 平台。双插槽平台可以用于增强安全性,增加指定位址空间大小和驱动基于云的机密计算环境。数据中心处理器在插槽内外的性能拓展,从根本上取决于相关架构的效率。第三代至强处理器增加了总体共享缓存,同时新的 Sunny cove 架构以及缓存架构升级,可以实现八个内存通道和最高 3200 的内存速度。

第二,作为仍然是目前唯一内置 AI 加速的数据中心处理器,英特尔增强了 AI 性能。这得益于英特尔在软件和指令集方面的投资,最新的至强处理器引入了 DL Boost 和 VNNI 指令集,可以对指令数量进行 4:1 或者是 3:1 的压缩。体现在性能上,比如 Mobilenet 模型处理能力提升了 66%,BERT 语言模型处理提升了 74%。

第三,第三代至强可扩展处理器内置英特尔密码操作硬件加速。“大家都在争先恐后的去加密用户数据,想走在威胁前面,这必然会带来一些‘性能税’,我们通过创新指令,降低算法成本,最新的至强处理器可以为很多重要的加密算法包括公钥对称加密、哈希法等提供突破性的性能。”Lisa Spelman 表示。

英特尔与 AMD 第三代 CPU 的性能对决

升级后的第三代至强,与几周前发布的 AMD 第三代 EPYC 对比有哪些优势?英特尔的技术专家给出了两者从架构、内存到工作负载的对比数据。首先是内存时延,无论是 L1、L2 还是 L3 级缓存,第三代至强比第三代 AMD EPYC 都有一定程度的优势。

“至强处理器可以直接访问统一的缓存,从而获得一致的响应时间和访问数据时间。竞争对手的产品有 8 个不同的计算芯片,每个都有独立缓存,如果数据在本地缓存,响应时间会很短,但数据不在本地缓存就需要到另一个芯片检索数据,因此本地缓存访问和远程访问响应的时间会差很多。”英特尔技术专家解释。

内存能力方面,第三代至强可以支持两条 DIMM 在最高 3200 的频率下运行,AMD 三代 EPYC 只能单通道运行 3200 的频率,这将会降低内存的吞吐量。DRAM 的时延,也因为架构的差别有所差异,至强在芯片旁边就是内存控制器,所以本地插槽延时更短,可以实现最高 30% 的性能提升。特别是,最新至强配容量可达 6TB 的傲腾持久内存,能够更好地实现快速访问。

接下来看在工作负载方面的提升。英特尔技术专家表示:“工作负载加速器指令就好比性能倍增器,它提供的增益要比仅向处理器添加核心所能带来的增益高很多。”这是至强 40 个核心能比 64 核心 EPYC 有更高性能的关键。

根据技术专家给出的数据,在高性能计算中,在至强 AVX-512 指令集的优化作用下,EPYC 的性能只达到 1,第三代至强的性能都在 1 之上。这种优化对于生命科学、化学、金融领域等的工作负载加速都有积极意义。

在云服务器和基础架构服务的工作负载中,第三代至强的加密指令可以显著提升速度,在网络交易库可以实现 2-3 倍的性能提升,对于云基础设施的新工作负载云专家等都能体现出优势。

对比 AI 推理能力,至强比 EPYC 的优势也十分明显,单一 AI 负载可以比 64 核 EPYC 高 25 倍。英特尔技术专家指出,“许多应用是在产品发布之后通过客户软件来持续提升,这种提升非常惊人,在一些 AI 推理中可以达到 30 倍的性能提升,一些应用时延降低了 10 倍。”

Lisa Spelman 说:“几年前开始我们就开始早早投资指令集和软件,这个战略正在产生巨大的回报。”

有意思的是,至强展现出的架构、时延的优势,其关键是传统架构与小芯片架构之间的差异。英特尔也在推动小芯片和先进封装技术的发展,未来也会将小芯片架构应用到至强处理器中,英特尔如何解决小芯片带来的挑战值得关注。

强调组合产品优势,英特尔至强出货有保证

“CPU 是客户购买决策的关键部分,但是这不是唯一的因素,其中最酷的因素之一就是让客户看到我们提供的整个产品组合。通过使用整个产品组合,客户能完成复杂而重要的购买决策。”Lisa Spelman 表示。

英特尔公司市场营销集团副总裁、中国区数据中心销售总经理陈葆立也说:“我们之前做过一些调查,企业购买一个服务器最关心的是可靠性、稳定性、大规模部署的实力。至强已经有 5000 万颗的出货量,非常多软件开发商已经有很多版本的优化软件,这对客户来而言是非常大的一个吸引力。对于至强或者是 x86 的竞争力,我们都非常有信心。”

因此,英特尔发布第三代至强可扩展处理器的同时,还发布了傲腾持久内存 200 系列,内存带宽增加 32%,每个插槽内存容量最高可以达到 6TB。

同时,号称世界上最快的数据中心固态硬盘傲腾 P5800X 也正式发布,IOPS 提升 4 倍,满足高速网络需求,TOS 最高提升 6 倍,满足最严苛 SLA 要求,相较 NAND 固态硬盘,延迟降低 13 倍。

除此之外,英特尔还发布了最新的以太网适配器 800 系列,吞吐量最高为 200GB/s,适合高性能 vRAN、NFV 转发面、存储、高性能计算、云和 CDN 等应用场景,能够为虚拟机的密度提供最多两倍的资源。

2019 年宣布的 Agilex FPGA 也在此次发布会上正式发布。Lisa Spelman 解释,由于对灵活性和敏捷性的要求都很高,所以 FPGA 的研发需要漫长的时间。采用英特尔 10 纳米 SuperFin 工艺的 Agilex FPGA,搭配 Quartus Prime 软件,与竞争对手的 7 纳米 FPGA 相比,能实现高于 2 倍的每瓦性能。

英特尔的组合产品在传统的零售等领域都展现出了优势。

“在某些情况下,通过软件优化,我们的处理器的性能会比发布的时候有所提升。对我们来说,关键的改变重点和战略是在我们交付的产品性能基础之上进行部署优化,而不是让我们的客户或者是解决方案团队直接转移到下一代产品的开发上去。”Lisa Spelma 同时表示。

陈葆立也提到:“头部客户我们直接和他们合作,一起做优化;中小企业更多是和方案商合作,我们全球有 500 个英特尔精选解决方案,我们还会继续投资,聚焦边缘网络、云、高性能计算、HPC 和传统的企业工作负载提供精选解决方案。”

头部客户的需求让至强在正式发布之前就已经出货了 20 万颗。陈葆立透露:“已经出货的 20 万颗至强第三代可扩展处理器,主要是一些重点客户,可以进行早期验证,包括他们内部的工作负载。”

Lisa 透露,第三代至强处理器在 2020 年底投入生产,2021 年一季度一直在加大生产力度。“我们打算利用自身 OEM 的优势最大限度满足市场对第三代产品的需求。所有主要的云服务提供商都计划部署 Ice Lake 的服务,他们会在 4 月份首次推出此类服务。我们有超过 50 个优秀的 OEM、ODM 预计将向市场推出超过 250 个基于 Ice Lake 的设计。“

英特尔公司副总裁兼中国区总经理王锐表示:“至强处理器的出货有保证,特别是数据中心。我们在全力提升产能,实际的提升比计划更高。”

小结

2015 年就开启并购布局 XPU 的英特尔,如今看来又一次引领了异构计算的时代。因此,在外界看来英特尔面临着 AMD 的挑战之时,英特尔依然能够凭借全面的产品组合来应对当下的竞争。当然也可以看到,在激烈的市场竞争之下,英特尔也愿意直接拿出详细的产品性能对比数据来证明自己的实力。

AMD 凭借选用台积电的先进工艺制程,以及更早使用小芯片设计赢得了再次抢夺英特尔 CPU 市场份额的机会,但在全球芯片缺货的背景下,产能抢夺成了纯芯片设计公司最具挑战的问题,同时,英特尔也从性能对比中指出了小芯片设计的不足,并且强调了至强独一无二的 AI 性能优势。在这样的情况下,拥有芯片工厂的英特尔也迎来了压制住 AMD 的好时机。

但是,面对来势汹汹的 Arm 和 RISC-V,以及大数据和 AI 时代更加多样化的需求,英特尔也无法高枕无忧,这或许也是英特尔更加重视定制化方案,与最终用户走的更近的原因所在。

迎来新任 CEO 以及进入 IDM 2.0 时代的英特尔,还能给我们带来惊喜吗?

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享