可以看到,Nvidia在Pascal架构上的总体思路与Kepler与Maxwell基本类似,但是相比较之前的架构而言还是有所进步,而且CUDA的数目也明显多了许多,晶体管数目也大幅度增加至恐怖的170亿个。但是核心面积却大幅度地缩小,很大程度的原因是制程从之前的28nm提升到16nmFinFET。
整个核心被分成了6组GPC(图形处理簇),这是具备高度独立性的GPU单元,拥有自己的渲染前端和后端。这种架构组成在Maxwell架构的完整核心GM200上就已经见过,这样的结构,使得Maxwell相对于Kepler的效率大大提升,并且大幅度地降低了功耗。
我们来看具体的GPC。每一个GPC都包含10组SM(流多处理器单元),而每个SM含有64个CUDA核心,也就是说整个GPU单元(完整版的Pascal核心)拥有60组SM、3840个CUDA核心,同时还有240个TMUs(纹理单元)。
值得注意的是,Nvidia在GP100上并不是完整版的Pascal架构,因为老黄为此关闭了8组SM,而CUDA自然而然地减少到了3584个,不过还是比Maxwell的旗舰核心GM200的3072个CUDA还是高了六分之一。
从GP100的CUDA数可以看出,我们完全有理由相信新Titan并不会是Pascal的顶级产品,未来Nvidia还将推出更为高端的Pascal显卡,到时候才是展现Pascal架构的完整威力。之前的Kepler架构的显卡就是这种形式,白色的GTX Titan的CUDA为2688个,而之后发布的GTX 780Ti和GTX Titan Black为完整版的2880个CUDA。或许在明年年末或者后年,完整版也就是搭载着3840个CUDA的Titan将会横空出世,与AMD的Vega显卡一决高下,到时候将会是火星撞地球的激烈场面!不过或许不久之后我们又要等待Nvidia新一代Volta显卡的降临了。
在图片的边缘我们可以看到八组显存控制器,也就是SK Hynix或者Samsung制造的HBM2显存,总位宽达到了4096Bits,一共为GP100核心提供高达720GB/S的超高带宽。值得注意的是,GP100核心并没有让显存带宽达到理论值的1TB/S,我们相信这是为了迎接GP110(假设代号)而准备的。当然八组HBM2显存共同为新Titan组成了16GB的超高速显存,为迎接4K分辨率的3A级大作做了最好的准备。
我们还可以在图中看到新的“High-speed Hub”(高速控制中心),并且衍生出四个NV-Link总线端口,Nvidia号称NV-link端口单项能够提供高达80GB/S的带宽。
NV-Link是一项全新概念的技术,甚至可以说是一项新理念。它并不是一个真的Link,而是一个能横跨在GPU和CPU之间,或者是GPU和GPU之间的快速互联机制,同时可以提供恐怖的高速带宽实现交互通讯。与此作类比就是Intel QPI与AMD HT。也就是说,未来的GPU将和CPU一样,通过这种桥梁使得CPU和GPU之间的联系更加紧密。
之后我们来看下Pascal的功耗,虽然CUDA数量是如此的恐怖,但是Tesla P100却依然运行在超高的频率之上,基础频率为1328Mhz,而Boost频率为1480Mhz,TDP为300W,这是由于16nmFinFET制程的加持才能让Nvidia获得如此高大的效率提升。
其实这些都不是重点,Pascal与之前的Maxwell与Kepler架构所不一样的是其中的FP32计算单元与FP64计算单元的大小完全一样!也就是说,Nvidia能够通过改变其中的某些FP64计算单元而大幅度提高单精度运算来让未来新的显卡在游戏性能上更加地强大,因为GP100的单精度运算性能的10.6TFlops相比较于前一代的提升幅度还是不够看,而5.3TFlops的双精度运算性能对于游戏来说几乎毫无用处,我们完全有理由相信未来的新Titan搭载的GP102核心将会通过转换FP64计算单元至FP32计算单元来大幅度地增加单精度运算性能,IT之家推测明年一月发布的GP102核心,也就是新Titan与GTX 1080Ti的单精度运算性能至少在12TFlops到14TFlops之间,到时候单卡60帧挑战4K分辨率游戏将不再是梦想!
当然距离搭载GP102核心的GTX 1080Ti与新Titan将于明年一月份首发,之前我们还是先看看次旗舰GTX 1070和GTX 1080的表现吧,如果说单路新Titan能够单抗4K分辨率的话,那么GTX 1080面对未来2K分辨率的游戏还是毫无压力的。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。