Nvidia Tesla P100所用核心参数解析：大幅增加双精度性能

2016-04-06 09:06IT之家 - 白猫

IT之家讯 4月6日消息，今天凌晨，Nvidia正式发布了新一代的计算卡Tesla P100，同时GP100也首次展现在人们的面前。目前，外媒已经为我们整理了关于GP100表格，并且与之前的两款计算卡进行对比，让我们深度剖析下这块号称史上最快的计算卡。

GP100核心内建3840个CUDA核心、240个纹理单元、最高32GB HBM2显存、位宽4096bit，L2缓存也从3MB提升到了4MB，据Nvidia官方所说，Nvidia Tesla P100采用的则是“阉割版”的GP100，因此采用了3584个CUDA核心，而且显存也缩水成了16GB HBM2显存。说实话，如果光看FP32，也就是单精度运算性能的话，那么GP100给人的惊喜并不大，10.6Teraflops的性能相比较于前代的7TFlops来说仅仅提升了51%，这对于一款使用16nmFinFET制程和新的架构来说未免让人失望。

GP100最大的变化就是大幅度地增加了FP64，也就是双精度运算性能，5.3Teraflops的双精度运算性能比较前一代GM200可怜的0.2Tflops来说可以说是质的飞跃，这也和Nvidia将未来的重心转移到VR和人工智能，需要强大的通用性能有关，只是对于消费者特别是游戏玩家来说，双精度运算性能毫无用处，我们更多的是关注显卡的单精度运算性能，按照之前所猜测的，正常的GP100预期的单精度运算性能为14-15Tflops左右，这样才能体现旗舰显卡的水准。同时随着晶体管的大幅度提升，GP100核心的TDP也大幅度增加，从250W升到300W。这对于未来想买新一代Titan作为游戏显卡的玩家来说需要注意了，可能您的电源需要更换成更大功率。

当然Nvidia Tesla P100不是用于游戏领域的，所以大幅度增加双精度运算性能也是情有可原，目前对于玩家来说，想要体会到GP100的还有一个办法就是等到GP102的上市，据称Nvidia将会为游戏玩家特别打造一款核心，也就是GP102。与Nvidia Tesla P100不同的是，GP102将会大幅度阉割FP64的双精度运算性能，而将剩余的晶体管性能一股脑地投入到单精度运算性能也就是FP32之中，还会增加大幅度增加核心频率与Boost频率，目的就是为了应对目前日益苛刻的游戏要求，当然最才是玩家最为关心的消息。

至于其他的游戏显卡，比如采用GP104的GTX1080与GTX1070，在这一次的GTC2016上是看不到了，恐怕我们需要到6月1日至6月6日的台北电脑展上才能看到相应的消息。如果需要等待Pascal游戏显卡的朋友，不妨先等等，目前的显卡先使用着，如果性能提升巨大就可以考虑购买，如果FP32的性能提升不大的话，那么还是等AMD的北极星出来来做决定。

如果你对于2016Nvidia GTC云里雾里的话，可以看看下面这篇小编为你总结的文章：

《Nvidia的2016年GPU技术大会：VR与人工智能》

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。