Nvidia Tesla P100所用核心参数解析:大幅增加双精度性能

2016-04-06 09:06IT之家 - 白猫

IT之家讯 4月6日消息,今天凌晨,Nvidia正式发布了新一代的计算卡Tesla P100,同时GP100也首次展现在人们的面前。目前,外媒已经为我们整理了关于GP100表格,并且与之前的两款计算卡进行对比,让我们深度剖析下这块号称史上最快的计算卡。

GP100核心内建3840个CUDA核心、240个纹理单元、最高32GB HBM2显存、位宽4096bit,L2缓存也从3MB提升到了4MB,据Nvidia官方所说,Nvidia Tesla P100采用的则是“阉割版”的GP100,因此采用了3584个CUDA核心,而且显存也缩水成了16GB HBM2显存。说实话,如果光看FP32,也就是单精度运算性能的话,那么GP100给人的惊喜并不大,10.6Teraflops的性能相比较于前代的7TFlops来说仅仅提升了51%,这对于一款使用16nmFinFET制程和新的架构来说未免让人失望。

GP100最大的变化就是大幅度地增加了FP64,也就是双精度运算性能,5.3Teraflops的双精度运算性能比较前一代GM200可怜的0.2Tflops来说可以说是质的飞跃,这也和Nvidia将未来的重心转移到VR和人工智能,需要强大的通用性能有关,只是对于消费者特别是游戏玩家来说,双精度运算性能毫无用处,我们更多的是关注显卡的单精度运算性能,按照之前所猜测的,正常的GP100预期的单精度运算性能为14-15Tflops左右,这样才能体现旗舰显卡的水准。同时随着晶体管的大幅度提升,GP100核心的TDP也大幅度增加,从250W升到300W。这对于未来想买新一代Titan作为游戏显卡的玩家来说需要注意了,可能您的电源需要更换成更大功率。

当然Nvidia Tesla P100不是用于游戏领域的,所以大幅度增加双精度运算性能也是情有可原,目前对于玩家来说,想要体会到GP100的还有一个办法就是等到GP102的上市,据称Nvidia将会为游戏玩家特别打造一款核心,也就是GP102。与Nvidia Tesla P100不同的是,GP102将会大幅度阉割FP64的双精度运算性能,而将剩余的晶体管性能一股脑地投入到单精度运算性能也就是FP32之中,还会增加大幅度增加核心频率与Boost频率,目的就是为了应对目前日益苛刻的游戏要求,当然最才是玩家最为关心的消息。

至于其他的游戏显卡,比如采用GP104的GTX1080与GTX1070,在这一次的GTC2016上是看不到了,恐怕我们需要到6月1日至6月6日的台北电脑展上才能看到相应的消息。如果需要等待Pascal游戏显卡的朋友,不妨先等等,目前的显卡先使用着,如果性能提升巨大就可以考虑购买,如果FP32的性能提升不大的话,那么还是等AMD的北极星出来来做决定。

如果你对于2016Nvidia GTC云里雾里的话,可以看看下面这篇小编为你总结的文章:

Nvidia的2016年GPU技术大会:VR与人工智能

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享