40 系显卡首批 7199 元起!赛博朋克 2077 帧数 x4,老黄:大部分像素都是 AI 预测而非计算

矿难来袭、玩家盘算何时下山之际,老黄带着他的 40 系显卡来了!

首发三款高端型号,RTX4090 24GB、RTX4080 16GB 和 12GB 显存两版。

话不多说,直接上规格:

三款游戏帧数测试,在 4K 分辨率、全高设置、开启光追与 DLSS 情况下,4090 提高到上代旗舰 3090Ti 的 2-4 倍,4080 与 3080Ti 对比也提高到原来的 2-3 倍

来看一组实机画面对比,来自《微软模拟飞行》

另外英伟达还与波兰蠢驴合作,给《赛博朋克 2077》开发了“全极致光线追踪模式”,软硬协作榨干所有性能,帧数直接 x4

要达成这些效果,靠的是全新 GPU 在制程工艺、硬件架构、软件算法上的一系列改进。

台积电工艺、DLSS3 放大招

全新架构 Ada Lovelace,切换到台积电 4N 定制工艺(5nm),专为生产 GPU 优化的那种,而 Ampere 时代用的还是三星 8nm。

新工艺加持下,RTX4090 塞进了 760 亿个晶体管、1.8 万个 CUDA 核心,比上一代增加 70%。

同时与上一代架构 Ampere 对比,能效比也有较大提升。

一个重头戏是 DLSS3,这一次 AI 能力不仅用于超分辨率,还会用于插帧。

老黄说,以后你看到的游戏画面中大部分像素都不是直接渲染出来的,而是 AI 预测的。

接下来,英伟达把新架构下的 SM 多单元流处理器、负责 AI 计算的 Tensor Core 与负责光追的 RT Core 都升级至新一代。

SM 多单元流处理器方面,最大的更新是“Shader 执行重排列”技术(Shader Execution Reordering)。

老黄讲到,光追吃性能的主要原因是 GPU 内部高度并行化、擅长做大量重复性高的工作。而光追场合下光线不断反射与全场景内不同材质交互并不能发挥 GPU 优势。

这项技术负责动态调度工作负载、合理安排计算资源,能给光追带来 2-3 倍性能提升,光追之外的综合游戏性能也提升 25% 左右。

这是与 CPU 乱序执行同等重要的计算革新。

张量核心 Tensor Core,用了数据中心 GPU H100 的同款,新增 FP8 精度数据格式支持,吞吐量增加 5 倍。

光线追踪核心 RT Core 方面,ray-triangle 交叉吞吐量提高两倍以上,还新增了 Opacity Micromap 引擎专攻树叶、粒子和栅栏这种光线通过缝隙的场景。

总的看下来,新显卡架构主要性能提升都是围绕光追,还有那么多不支持光追的老游戏怎么办?

为解决这个问题,英伟达推出游戏 MOD 开发工具 RTX Remix

一边玩游戏一边打开它,就能直接从 GPU 渲染指令里拦截游戏的图形资产,包括几何建模、材质、灯光、摄像机位置等。

在 AI 辅助下给这些资产增加细节、超分辨率、增加物理性质、添加光追和 DLSS 支持都不在话下。

还能一键打包成 MOD 发布,让老游戏也能焕发第二春,比如让 20 年前的《上古卷轴・晨风》画质超过最新的《上古卷轴・天际》。

英伟达官方为经典解谜游戏《传送门》制作了光追 MOD,将以免费 DLC 的形式稍后发布。

全在讨好玩家,除了价格

相较于 RTX30 系列,40 系列显卡的性能增强够有诚意了,那么价格如何呢?

直接来看黄老板给出的价格:

RTX 4090 定价 1599 美元

RTX 4080(16GB)定价 1199 美元

RTX 4080(12GB)定价 899 美元。

在国内,目前给出的售价是:

RTX 4090 12999 元起

RTX 4080(16GB)9499 元

RTX 4080(12GB)7199 元。

为了方便比较,也顺便把之前国内 RTX30 系列的官方售价摆上来:

RTX 3090 11999 元

RTX 3080 5499 元

RTX 3070 3799 元

从给出的定价来看,90 系列的变化幅度并不是很大,国内售价在原来的基础上涨了一点,算得上是“高性价比”(但这价格依旧是普通网友可望不可及)。

对比之下,80 系列新出的两款显卡涨价就比较明显,RTX 4080(16GB)相较于 3080 涨价近 50%,被外界认为是对标 RTX 3070 的 RTX 4080(12GB)也涨了近 50%。

网友直呼:这根本没想让我们买 40 啊。

(看来黄老板饱受矿难其害,不知道手里还有多少 30 系显卡)

不过游戏发烧友们也可以再等等。

在得知英伟达要发布 40 系列显卡后,AMD 也坐不住了,后脚就透露消息称:11 月 3 日会发布 RX 7000 系列显卡。

并且还放出了一张性能对比图,称其性价比高,能效好。

值得一提的是,虽然这次 RTX40 系列相较于 30 系列性能翻倍,但功耗方面却没有很大的涨幅。

RTX 4090 功耗正如之前传言一样为 450W 与 3090Ti 持平,RTX 4080(16GB)为 340W,RTX 4080(12GB)为 285W.

对于 RTX4090,英伟达建议使用 850W 的电源,12GB 的 RTX 4080 需要 700W 的电源,16GB 需要 750W 的电源。

不仅如此,英伟达此次还升级了散热系统,进一步优化了双轴流通系统,将风扇尺寸和翅片体积增加了 10% ,并升级为 23 相电源。

(这尺寸倒是越来越大了)

甚至有网友调侃称:

除此之外,大家的 AI 导师李沐也第一时间给出了自己的看法。

4090 相比 3090Ti,AI 训练来说重要的参数都没增强,增强多卡并行的 NVlink 还给砍了,不如再等等 4090Ti。

这次的 40 系新卡,你冲吗?

参考

  • [1]https://www.nvidia.cn/geforce/graphics-cards/40-series/

  • [2]https://www.youtube.com/watch?v=Uo8rs5YfIYY

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享