【IT之家评测室】影驰 GEFORCE RTX 5090 D 大将显卡评测:DLSS 4 新科技表现强劲,迈向游戏性能之巅
今年的 RTX 50 系列显卡收获了极高的外界关注,毕竟距离上代 RTX 4090 显卡发布已经过去 2 年多时间了。依照惯例依旧是先推出最高端的 RTX 5090,它更新了全新一代 Blackwell 架构,拥有 GDDR7 32GB 超大显存和 DLSS 4 技术加持,性能表现令人期待。
那么今天我们就从这张影驰 GEFORCE RTX 5090 D 大将显卡入手,看看它的表现能否回应大家的期待。
为了发挥影驰 GEFORCE RTX 5090 D 大将显卡的全部实力,本次的测试平台配置如下:
一、外观设计
影驰 GEFORCE RTX 5090 D 大将显卡这次采用了暗黑风格的视觉呈现,官方称其为“旭日黑铠”。显卡整体为黑色外壳,表面进行了类凯夫拉样式的锯齿条状纹理,搭配左右两侧如古代机械机关一样的纹路装饰,整体呈现出非常浓郁的暗黑机械风。
风扇部分的半透明磨砂处理很显纤薄,而中间风扇外轮廓边缘还有一圈“尖刺”设计,对应了“旭日黑铠”的主题,同时彰显出官方在设计上的大胆狂野。卡身造型非常方正,这与卡面设计形成对比。
新一代的霜环风扇包含 2 个 100mm 直径风扇和 1 个 90mm 直径风扇;扇叶数量调整到 7 叶,风压提升约 15%,同转速下噪音降低 5%,整体使用体验更好。
尺寸方面,影驰 GEFORCE RTX 5090 D 大将显卡的三围分别是 339 * 151 * 60mm(含挡片),49.7mm(不含挡片),净重约 1.88kg。
相比正面装甲来说,显卡背板的设计有所收敛,左侧印有大大的 GEFORCE RTX 标志,右侧的圆角矩形开口内部还做了四个梯形斜对称的个性镂空装饰。透过右侧进风开孔,可以看到内部非常密集的散热格栅。本次影驰 GEFORCE RTX 5090 D 大将显卡延续了全金属加固的背板设计,内部也升级了散热模组的鳍片面积,还有 7 根 Φ8mm 镀镍复合热管、回流焊接工艺和合金压铸中框加强件等设计,保证为显卡核心提供出色的散热性能。
显卡正面装甲也对侧面形成了全包裹支持,有效提升保护性的同时,也让一体性变得更强。
金手指区域改成了新版 PCIe5.0*16 规格设计。
显卡另一侧做了左右不规则高度的设计,左侧印有 GEFORCE RTX 标志,右侧则是一个独立灯带区域,一直延伸到另一面三分之二的位置,呈现 L 形,满足在侧透和海景房机箱内横向显卡安装时,更加凸显 ARGB 灯光效果。
侧边居中靠上位置还有 4pin 的 ARGB 灯光控制接口以及 16pin 显卡供电接口。
接口挡板区域,影驰同样设计了如动物鳞片般的不规则开孔组,接口包含 3 个 DP2.1b 和 1 个 HDMI2.1b,跟进到最新规格。
配件方面,影驰 GEFORCE RTX 5090 D 大将显卡提供了 1 根 16pin 转 4*8pin 供电转接线,1 根灯光同步线和 1 组可拆卸设计的全金属显卡支架。
二、技术解析
NVIDIA GeForce RTX 5090 D 采用了全新的 Blackwell 架构,官网的介绍页面赫然写着一列“专为游戏玩家和创作者打造的致胜平台”,其中所代表的就是游戏性能和 AI 性能的爆增。英伟达称,目前对于画面质量的追求已大幅度超越了摩尔定律所能够提供的运算性能,加入神经网络渲染势在必行。
由于加入了神经网络渲染,Blackwell 的多单元流处理器 (SM) 具有更高的处理吞吐量,并与 Tensor Core 更紧密结合,从而优化神经网络着色器的性能。Blackwell 架构搭载了基于硬件的 Flip Metering,将帧率逻辑转移到显示引擎中,使得 GPU 能够更精确地管理显示时间。
在第五代 Tensor Core 中新增了对 FP4 浮点运算精度的支持,FP4 是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率。FP4 显存占用不到 FP16 的一半,而 GPU 性能的提升却高达 2 倍。在生成式 AI 应用中,GeForce RTX 5090 D 的 FP4 图像生成速度是 RTX 4090 D 上 FP16 的 3 倍,显存占用和计算量均显著降低。
在 RT Core 方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代 Blackwell 架构下光线、路径与三角形相交的检测效率为上一代的 2 倍,初代使用 RT Core 的 Turing 架构性能的 8 倍,并增强了压缩以减少内存占用,相比上代的显存使用率节省了 25%,光线追踪效果也得到了前所未有的细节提升。
除了技术上的提升,Blackwell 架构的 GPU 还搭载了 GDDR7 显存。GDDR7 采用的是 PAM3 信号编码机制,与 GDDR6 和 GDDR6X 有所区别。PAM3 每两周期的数据传输为 3 位,相比 GDDR6 和 GDDR6X 更省电,带宽也进一步提升,速度高达 30Gbps。
Blackwell 还通过 PCIe 5.0 和 DisplayPort 2.1b UHBR20 实现了增强,单一通道支持 20Gbps 带宽,从而支持高达 8K 165Hz 的显示器。Blackwell 架构 GPU 配备了第九代 NVENC,支持 H.264 / H.265 4:2:2 编码的 8 位和 10 位视频输出。
具体到产品规格上,影驰 GeForce RTX 5090 D 大将显卡基于最新一代 GB202 核心和 TSMC 4N 架构制程工艺打造,内有 21760 个 CUDA 核心、680 个 Tensor 核心、170 个光追核心、680 个纹理单元、176 个 ROP 单元,核心规模相比 RTX 4090 大致相当,但解锁了完整的 GPC 单元,单元内的 SM 和 TPC 群组数量均有增加。
影驰 GEFORCE RTX 5090 D 大将显卡的 GPU 频率范围是 2017MHz-2407MHz。显存方面升级为 512-bit 32GB GDDR7,带宽来到了 1792GB/s。TBP 功耗为 575W,相比上代 RTX 4090 增加了 125W。
三、理论跑分
看完核心规格,接下来就进入理论测试环节。
首先是烤机,单烤甜甜圈 20 分钟,GPU 的核心温度稳定在 73℃左右,显卡频率 2625MHz,功耗稳定在 575W 左右,基本和公版保持一致。
在 3DMark Time Spy DX12 测试中,影驰 GEFORCE RTX 5090 D 大将显卡分数达到了 49014 分,作为对比 GeForce RTX 4090 公版的分数为 34725 分,提升幅度达到了 41.1%。
而在 3D Mark Time Spy Extreme DX12 测试中,影驰 GEFORCE RTX 5090 D 大将显卡的分数达到了 26059 分,作为对比 GeForce RTX 4090 公版的分数为 19924 分,提升幅度达到了 30.7%。
在 3DMark Portal Royal 实时光追测试中,影驰 GEFORCE RTX 5090 D 大将显卡的综合分为 37061 分,作为对比 GeForce RTX 4090 公版的分数为 25080 分,提升幅度达到了 47.7%。
以上几项 3D Mark 基准测试的结果不言而喻,影驰 GEFORCE RTX 5090 D 大将显卡的图形性能提升显著,相较上代 RTX 4090 D 提升了 30%-50%,这让我们对接下来的性能表现更加期待。
四、游戏实测
虽然 NVIDIA 官方宣称首批支持 DLSS 4 的游戏高达 75 款,不过目前能够顺利开启 DLSS 4 相关选项的游戏非常有限,所以多数主流游戏我们依旧测试的是 DLSS 3 和帧生成的表现,然后通过《赛博朋克:2077》和《心灵杀手 2》两款游戏单独为大家呈现 DLSS 4 技术的实际表现。
1、《CS2》
第一个是 Steam 上活跃度最高的在线游戏之一《CS2》,我们直接运行游戏创意工坊中的 FPS BenchMark 地图:
在 4K 分辨率 + 高画质下,游戏平均帧数为 426 帧,1% Low 帧 186 帧;
在 2K 分辨率 + 高画质下,游戏平均帧数为 627 帧,1% Low 帧 240 帧;
这个表现相当可以,差点让人以为运行的还是初代《CS:GO》,高帧数下的游戏体验非常畅快。
2、《永劫无间》
《永劫无间》这款游戏一直都非常积极于 DLSS 技术的适配,NVIDIA 官方还透露后续将与这款游戏合作,推出 NVIDIA ACE 技术的 AI 队友更新,经过实测:
在 4K 分辨率 + 最高画质下,游戏平均帧数为 242 帧,1% Low 帧 174 帧;
在 4K 分辨率 + 最高画质 + DLSS 质量下,游戏平均帧数为 320 帧,1% Low 帧 161 帧;
可以看到即使只开到对画质影响最小的 DLSS 质量档,游戏帧数也有 78 帧的提升,效果非常明显。
3、《无限暖暖》
接下来是一款端游,“优化出色”的《无限暖暖》对硬件资源的开销非常大,尤其对 GPU 的压力显著。
在 4K 分辨率 + 极致画质 + TAA 抗锯齿下,游戏平均帧数为 169 帧,1% Low 帧 122 帧;
在 4K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 166 帧,1% Low 帧 126 帧;
这个平均帧数相比 RTX 4090 D 的提升了 50%,最重要的 1% Low 帧也过百了,对《无限暖暖》这种精准平台跳跃的游戏类型,体验直接好了一个档次。
在 2K 分辨率 + 极致画质 + TAA 抗锯齿下,游戏平均帧数为 226 帧,1% Low 帧 149 帧;
在 2K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 190 帧,1% Low 帧 151 帧;
来到 2K 分辨率下值得注意的是,1% Low 帧的提升比较明显。两种抗锯齿模式下 1% Low 帧分别提升了 27 和 25 帧。
4、《古墓丽影:暗影》
传统光栅单机游戏可以考察一下 RTX 5090 D 在非光追和 DLSS 时的性能表现:
在 4K 分辨率 + 最高画质下,游戏平均帧数为 244 帧,1% Low 帧 177 帧;
在 2K 分辨率 + 极致画质下,游戏平均帧数为 360 帧;1% Low 帧 229 帧;
相比上一代 RTX 4090,4K 和 2K 分辨率下的游戏平均帧数提升分别达到了 35.5% 和 44.9%。
5、《极限竞速:地平线 5》
《极限竞速:地平线 5》有着较为出色的优化:
在 4K 分辨率 + 极端画质下,游戏平均帧数为 201 帧,1% Low 帧 162 帧;
在 2K 分辨率 + 极端画质下,游戏平均帧数为 254 帧,1% Low 帧 180 帧;
相比上一代 RTX 4090 D,4K 和 2K 分辨率下的游戏平均帧数提升分别达到了 28% 和 38%。
6、《孤岛惊魂 6》
接下来就是光追游戏了,首先是《孤岛惊魂 6》,它对 CPU 的单核性能要求也很高,支持光追和 DLSS。经过实测:
在 4K 分辨率 + 极高画质下,游戏平均帧数为 188 帧,1% Low 帧 109 帧;
在 4K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 165 帧,1% Low 帧 87 帧;
相比上一代 RTX 4090 D,4K 默认和 4K 光追下的游戏平均帧数提升分别达到了 47.3% 和 47.1%,提升幅度接近 50%。
在 2K 分辨率 + 极高画质下,游戏平均帧数为 245 帧,1% Low 帧 118 帧;
在 2K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 199 帧,1% Low 帧 98 帧;
相比上一代 RTX 4090 D,2K 默认和 2K 光追下的游戏平均帧数提升分别达到了 41% 和 51.6%。
7、《黑神话:悟空》
在“众生平等”代表之作《黑神话:悟空》中,开启全景光追后的显卡压力非常高。经过实测:
4K 分辨率 + 影视级画质 + 50% 超采样分辨率下,游戏平均帧数为 103 帧;
4K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 134 帧;
可以看到在 RTX 5090 D 的加持下,4K 分辨率 + 影视级画质的黑猴也能达到 100 帧以上的游戏平均帧数,体验提升巨大。
在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率下,游戏平均帧数为 115 帧;
在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 181 帧;
五、DLSS 4 游戏体验
目前 RTX 40 系列已经支持的 DLSS 3 技术实际效果已经非常强大了,DLSS 4 在 DLSS 3 的技术上,再次提升了帧生成的性能潜力,运用全新的多帧生成技术,结合第五代 Tensor Core 的强大性能,利用 AI 为每个渲染帧生成至多 3 个额外帧,从而大幅提升游戏的 FPS 水平。
DLSS 4 配合全套 DLSS 技术,包括光线重建、超分辨率以及 DLAA 等功能,最多可实现传统图像渲染的 8 倍帧率。拥有 DLSS 4 技术的游戏,玩家使用 RTX 5090 D 可轻松解锁 4K 240 FPS 全景光追的满血性能体验。
多帧生成技术还可配合 NVIDIA Reflex 低延迟技术保持较低的游戏延迟,让游戏的操作和响应影响很小,毕竟 GPU 为每个渲染帧计算时,都涉及到超分辨率、光线重建和多帧生成等多维度,延迟是影响游戏体验的重要指标。不过,尽管延迟的增加不可避免,但 GeForce RTX 50 系列的第 5 代 Tensor Core 在 AI 处理性能上提升了 2.5 倍,实际延迟增幅被控制在较低水平,具体我们将在下面的游戏实例中为大家演示。
Blackwell 显示引擎也在 DLSS 4 技术发挥了重要作用,通过提升其像素处理能力,让游戏在更高分辨率和刷新率下满足 DLSS 4 技术的要求,最高可提升 1 倍的像素处理能力。
DLSS 4 技术还带来了模型架构的重大升级,DLSS 光线重建、DLSS 超分辨率和 DLAA 特性均由首个实时 Transformer 模型驱动,并用来提升生成像素的质量,它支持通过自注意力操作评估整个帧及多个帧中每个像素的重要程度,更好理解场景关系,让生成的像素具有更好稳定性、更少的伪影、更丰富的运动细节和平滑边缘。
官方表示,目前已有超过 75 款支持 DLSS 帧生成技术的游戏和应用可在 GeForce RTX 50 系列 GPU 上升级至 DLSS 多帧生成技术,不少主流 3A 大作也将于 50 系显卡正式发售后不久体验到 DLSS 4,包括《心灵杀手 2》、《夺宝奇兵:古老之圈》、《黑神话:悟空》、《星球大战:亡命之徒》《寂静岭 2:重制版》等热门作品。
《赛博朋克:2077》作为首批适配 DLSS 4 技术最快最好的游戏之一,非常适合通过它来了解 DLSS 4 技术的实际体验。如果在 4K 分辨率下开启光追,但不开启 DLSS 和帧生成选项,那么:
在 4K 分辨率超级光追画质下,游戏平均帧数为 60 帧;
在 4K 分辨率超速光追画质下,游戏平均帧数为 35 帧;
即使是 RTX 5090 D 面对 4K 分辨率 + 光线追踪条件下硬刚物理图形性能,压力依旧非常大,超级光追尚可跑到 60 帧的流畅基准线,超速光追(路径光追)就力不从心了。
如果是 4K 分辨率 + 超级画质,不开光追和 DLSS,游戏平均帧数的表现还可以,能达到 116 帧。
接着我们看下多帧生成的选项,打开帧生成选项后,下面多出了一个多帧生成的倍率选择项,即 DLSS Multi Frame Generation,可选择 2x、3x 和 4x 这 3 种生成倍率。
我们依次在 4K 分辨率 + 超级光追画质 + DLSS 性能设置下,选择 2x、3x 和 4x 多帧生成,运行游戏基准测试,分别得到了 217 帧、302 帧和 379 帧的游戏平均帧数,2x 和 3x 多帧生成的表现,非常接近 116 帧的 2 倍和 3 倍帧数,而 4K 分辨率下的 4x 多帧生成所带来的 379 帧则更加恐怖如斯。
当我们进一步切换到超速光追画质 + DLSS 4 多帧生成 4x 时,游戏平均帧数也有 295 帧。谁能想到在目前最吃图形性能的《赛博朋克:2077》上,我们跑出了远超主流 3A 光追游戏的应有性能,可以说 DLSS 4 技术彻底颠覆了大家对于游戏性能的认知。
当然,无论是何种形式的插帧,延迟的增加都不可避免,所以我们也实测了关闭和打开多帧生成后的延迟表现。
在关闭帧生成选项的情况下,同一场景下 4K 超级画质和 4K 超级光追画质的游戏平均延迟分别为 15ms 和 18ms。
而切换到超速光追画质后,依旧在同一场景下分别开启 2x、3x 和 4x 多帧生成,游戏平均延迟分别为 21ms、24ms 和 27ms。
相比开启帧生成之前,游戏平均延迟的确有一定增加,但幅度非常小。超速光追 + 2x 多帧生成对比超级光追且无帧生成仅增加了 3ms,随后的 3x 和 4x 多帧生成延迟依次递增 3ms,总体延迟都控制在 30ms 以内,对于非竞技类单机游戏来说这个表现完全可以接受。
除了 DLSS 4 技术外,新一代 NVIDIA Reflex 2 低延迟技术也可进一步降低游戏的延迟表现,提升操作手感和响应速度。过去四年里,NVIDIA Reflex 已集成到超过 100 款游戏中,可以将 PC 延迟降低 50%。新的 Reflex 2 将采用一项 Reflex Frame Warp 技术,通过把最新的鼠标输入指令及时同步给渲染帧,实时刷新和控制渲染出的游戏帧,可以说是定制化的低延迟调整了。
NVIDIA Reflex 2 将在未来不仅支持主流竞技游戏和动作游戏,如《无畏契约》等。相信通过这一技术,开启 DLSS 4 之后的游戏低延迟表现会更加出色。
我们再来看《心灵杀手 2》的表现。在 4K 分辨率 + 原生最高画质下,游戏的平均帧数为 74 帧,注意此时游戏的延迟只有 36ms。
而一旦我们开启光追选项,游戏平均帧数立刻会跌到无法流程游玩的水平:
4K 分辨率 + 原生最高画质 + 光追下,游戏平均帧数为 40 帧,1% LOW 帧 37 帧;
4K 分辨率 + 原生最高画质 + 路径光追下,游戏平均帧数为 28 帧,1% LOW 帧 25 帧;
与此同时,大家应该也注意到开启光追后的游戏平均延迟会大幅提升,由原先的 36ms 提升到了 65ms 和 92ms,即使帧数勉强达到 30 帧的主机流畅线,游戏体验也很难舒适。那么 DLSS 4 技术能扳回一城吗?
开启多帧生成后,局势立刻发生了逆转,2x、3x 和 4x 多帧生成下的游戏平均帧数分别为 132 帧、186 帧和 249 帧,虽然没有《赛博朋克:2077》最高接近 300 那样夸张,但性能的提升也是显而易见的。
而在游戏平均延迟的表现上,开启多帧生成后,延迟相比 4K + 路径光追下降低了一半,来到 45ms,2x、3x 和 4x 多帧生成下的增幅和《赛博朋克:2077》保持一致,都是 3ms 的递增,毫无疑问 Reflax 低延迟功劳很大。考虑到《心灵杀手 2》刚刚适配 DLSS 4,目前的延迟表现可以接受,希望游戏后续能够进一步优化延迟表现。
那么多帧生成会影响画质吗?通俗点说就是会不会令画面变得更糊?为此我们也在《心灵杀手 2》中同一个场景截取了 3 种不同画质设置的游戏画面,分别是:
4K 原生画质 + 路径光追;
4K 最高画质 + DLSS 性能档(1080P 渲染)+4x 帧生成
4K 最高画质 + DLAA(4K 渲染)+4x 帧生成
然后通过 NVIDIA ICAT 工具进行比较,在不放大的情况下 3 者根本看不出区别,所以我们挑选了 3 处细节进行放大对比。
首先是警员手臂衣服上的 FBI 标志,左侧和右侧分别是 DLAA(4K 渲染)和原生 4K 画质,中间是 DLSS 性能(1080P 渲染),经过放大可以看到中间图片的 FB 文字更糊一点,但左右基本看不出清晰度上的区别。
同样在警员的波浪卷发以及身旁右侧的树叶上也能看出中间的画面更糊一点,左右两边的图片却难以发现差距。
也就是说对于物理渲染分辨率上的天然鸿沟,DLSS 技术肯定是无法完全弥补画质差距的,但只要保持和原生画质相同的分辨率(即开启 DLAA),画面清晰度和细节几乎没有区别,更别说我们这种“盯帧式”比较有点吹毛求疵,正常游戏无论是 DLSS 性能档(1080P 渲染)还是 DLAA(4K 渲染)都不会有糊成一片,锯齿满满这种明显问题,所以最主要的还是看游戏适配,在乎画质的小伙伴直接开启 DLAA 就好了。
六、总结
从实测结果来看,今年的 RTX 5090 D 凭借 DLSS 4 技术加持,在游戏性能和游戏体验上都带来了颠覆性的升级,不论是成倍提升的游戏平均帧数,还是优秀的延迟控制,极小的画质损失,都无愧于游戏卡皇的宝座。
而在外观上,全新设计的影驰 GEFORCE RTX 5090 D 大将显卡采用了大胆的暗黑视觉风格,尤其是风扇外轮廓的一圈“尖刺”设计非常大胆,还有显卡侧边的纹路 RGB 灯带,都很适合对个性化有独特追求的玩家,其略带夸张和狂野的造型表达,无疑在今年的 RTX 50 系显卡中独树一帜。综合来看,影驰 GEFORCE RTX 5090 D 大将显卡的整体表现出色,相信一旦上市立刻会成为游戏玩家和创作者们的心头好。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。