【IT之家评测室】NVIDIA GeForce RTX 5070 显卡评测:2K+4K 游戏全能王,性价比一下子有了
从年前到现在,新一代 RTX 50 系显卡陆续发布,PC 游戏党终于等到了面向主流玩家群体的 NVIDIA GeForce RTX 5070 显卡。全新支持的 DLSS 4 技术和 12GB GDDR7 规格显存能否让更多玩家畅玩 4K 分辨率下的主流 3A 大作,今天我们就通过 NVIDIA GeForce RTX 5070 公版显卡一探究竟。
为了发挥显卡的全部性能,本次我们搭建了如上图所示的硬件测试平台。
一、外观设计
不得不说 NVIDIA 每年推出的公版显卡在包装和设计上都颇具创意,今年也不例外。
NVIDIA GeForce RTX 5070 显卡采用了较为环保的原色纸箱包装,通过侧边抽拉式固定纸片进行密封,抽取方便且有仪式感。纸箱上印有 GeForce RTX 5070 的显卡型号,整体造型也暗示了显卡的对称美学设计风格。
NVIDIA GeForce RTX 5070 显卡在外观设计上与此前我们测过的 NVIDIA GeForce RTX 5080 公版卡基本保持一致,全黑化的金属装甲、搭配经典 X 造型的银色风扇外框装饰,凸显质感的同时,也保持了公版卡一贯的美学格调。
风扇部分也采用了黑化涂装,由于主板两侧的散热鳍片的前后均没有遮挡,两个 110mm 直径的大尺寸风扇可吹透鳍片,提升散热效率。
显卡尺寸方面经过IT之家实测,三围分别是 244*98*40mm(不含挡片),上秤重量为 1.1kg。NVIDIA GeForce RTX 4070 公版卡(1.008kg)重量基本保持一致,尺寸则更小巧一些。
显卡另一面对应着双风扇的位置,布满了非常密集的竖向散热鳍片,便于散热。X 造型“沙漏”包边的中间三角形边缘部分做了圆润的弧形过渡,让握持的手感更加柔和。其中一个三角区域印着小小的 RTX 5070 标志。
显卡的两侧均采用 2 组散热开口,其余部分均被厚实的“沙漏”装甲包裹起来。一侧的散热开口旁边就是斜向 45℃设计的 16pin(12+4)供电接口,更右侧的 GeForce RTX 字母标志并无灯效,尽显简约与克制。
金手指部分依旧采用全新 PCIe5.0 规格。
最左侧 I/O 接口的金属挡板上,配备了 3 个 DP2.1b 接口和 1 个 HDMI2.1b 接口,最高支持 8K / 165Hz 视频输出。接口下方对应四个方形散热开孔,排列非常规整。
配件方面,包装内附有 1 根黑色尼龙材质 16pin 转双 8pin 的电源转接线以及 1 本快速入门指南。
二、架构分析
Blackwell 架构
RTX 50 系列显卡这次采用的 Blackwell 加入了神经网络渲染的特性,其多单元流处理器 (SM) 具有更高的处理吞吐量,并且支持了 Flip Metering 来代替 CPU Pacing,让 GPU 更精准管理显示时间,尽可能达到每帧的画面生成时间保持一致,从而满足 DLSS 多帧生成的稳定性需求。
第五代 Tensor 核心
第五代 Tensor 核心能够加速重新排序,并新增了对 FP4 精度模型的支持,相较于第四代 Tensor 核心上所支持的 FP8 精度模型,吞吐量提升 2 倍;相比 FP16 精度模型,FP4 的显存使用不到一半,GPU 性能的提升却高达 2 倍。正是由于第五代 Tensor 核心的加入,才让 DLSS 4 技术能够顺利支持多帧生成功能。
第四代 RT 核心
在 RT 核心方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代 Blackwell 架构下光线、路径与三角形相交的检测效率为上一代的 2 倍,初代使用 RT 核心的 Turing 架构的 8 倍,并增强了压缩以减少内存占用,相比上代的显存使用率节省了 25%,光线追踪效果也得到了前所未有的细节提升。
配备 GDDR7 显存
除了技术上的提升,Blackwell 架构的 GPU 还搭载了 GDDR7 显存。GDDR7 采用的是 PAM3 信号编码机制,与 GDDR6 和 GDDR6X 有所区别。PAM3 每两周期的数据传输为 3 位,相比 GDDR6 和 GDDR6X 更省电,带宽也进一步提升,速度高达 30 Gbps。
RTX 5070 规格
具体到产品规格上,NVIDIA GeForce RTX 5070 显卡基于最新一代 GB205-300 核心和 TSMC 4N 工艺打造,包含 6144 个 CUDA 核心、988 个 Tensor 核心、94 个光追核心。
NVIDIA GeForce RTX 5070 显卡的核心工作范围是 2330MHz~2510MHz,显存方面升级为 192-bit 显存位宽的 16GB GDDR7 规格,总带宽来到了 672GB/s。TDP 为 250W,相比上代 NVIDIA GeForce RTX 4070 显卡增加了 50W。
三、理论跑分
首先是烤机环节,NVIDIA GeForce RTX 5070 显卡在甜甜圈单烤 20 分钟后,GPU 功耗稳定在了 250W,GPU 主频比较保守只有 2385MHz,而 GPU 温度则是 76.7℃。对比 NVIDIA GeForce RTX 4070 的烤机表现来看,功耗和温度均有一定程度增加。不过考虑到 NVIDIA GeForce RTX 5070 显卡的整体尺寸缩小了不少,更加轻薄,温度略高一些,问题不大。
在 3DMark Time Spy DX12 测试中,NVIDIA GeForce RTX 5070 显卡分达到了 22300 分,对比 NVIDIA GeForce RTX 4070 显卡的 17392 分,提升幅度约 28.2%。
在 3D Mark Time Spy Extreme DX12 测试中,NVIDIA GeForce RTX 5070 显卡分达到了 10643 分,对比 NVIDIA GeForce RTX 4070 显卡的 8261 分,提升幅度约 28.8%。
在 3DMark Portal Royal 实时光追测试中,NVIDIA GeForce RTX 5070 显卡的综合分为 14052 分,对比 NVIDIA GeForce RTX 4070 显卡的 11006 分,提升幅度达到了 27.6%。
从理论测试的表现上看,NVIDIA GeForce RTX 5070 显卡相比上代的理论图形性能平均提升了 28%,这个成绩比较不错,加上支持 DLSS 4 技术,我对这张卡的 4K 游戏表现更为期待。
四、游戏实测
上一代 NVIDIA GeForce RTX 4070 显卡在 4K 游戏的表现上,不少玩家都觉得还差点意思,因为有些游戏并不能做到 4K 分辨率 + 画质拉满稳定 60 帧以上的平均帧数,所以它依旧被定义为 2K 游戏显卡,那么这次的 NVIDIA GeForce RTX 5070 的性能表现能够驾驭 4K 游戏吗?
1、《CS2》
在竞技游戏《CS2》中:
RTX 5070 在 4K 分辨率 + 高画质下,游戏平均帧数为 214 帧,1% Low 帧 92 帧,平均延迟 12ms;
RTX 4070 在 4K 分辨率 + 高画质下,游戏平均帧数为 162 帧,1% Low 帧 85 帧,平均延迟 16ms;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 32%,1% Low 帧提升 8.2%,平均延迟降低 25%。
RTX 5070 在 2K 分辨率 + 高画质下,游戏平均帧数为 373 帧,1% Low 帧 135 帧,平均延迟 8ms;
RTX 4070 在 2K 分辨率 + 高画质下,游戏平均帧数为 269 帧,1% Low 帧 124 帧,平均延迟 11ms;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 38.6%,1% Low 帧提升 8.8%,平均延迟降低 28%。
2、《永劫无间》
《永劫无间》作为在线竞技游戏中支持 DLSS 技术的代表游戏,对显卡性能的考验更为综合,经过实测:
RTX 5070 在 4K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 103 帧,1% Low 帧 77 帧,平均延迟 41ms;
RTX 4070 在 4K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 76 帧,1% Low 帧 45 帧,平均延迟 56ms;
NVIDIA GeForce RTX 5070 相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 35.5%,1% Low 帧提升 71.1%,平均延迟降低 27%。
RTX 5070 在 2K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 168 帧,1% Low 帧 118 帧,平均延迟 27ms;
RTX 4070 在 2K 分辨率 + 最高画质 + DLSS 质量模式下,游戏平均帧数为 119 帧,1% Low 帧 51 帧,平均延迟 39ms;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 41.1%,1% Low 帧提升 131%,平均延迟降低 31%。
可以看到,《永劫无间》这款游戏中 NVIDIA GeForce RTX 5070 的 1% Low 帧提升巨大,游戏平均帧数的提升也很恐怖。
3、《无限暖暖》
《无限暖暖》作为一款上市不到半年的端游,目前在游戏性能上可优化的空间还很大,这款游戏目前也支持了光线追踪和 DLSS,经过实测:
RTX 5070 在 4K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 81 帧,1% Low 帧 66 帧;
RTX 4070 在 4K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 66 帧,1% Low 帧 57 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 22.7%,1% Low 帧提升 15.7%。
RTX 5070 在 2K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 121 帧,1% Low 帧 102 帧;
RTX 4070 在 2K 分辨率 + 极致画质 + 开启光追 + DLSS 抗锯齿下,游戏平均帧数为 102 帧,1% Low 帧 81 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 18.6%,1% Low 帧提升 25.9%。
4、《古墓丽影:暗影》
《古墓丽影:暗影》只支持初版 DLSS,可以看作是传统光栅游戏的代表,经过实测:
RTX 5070 在 4K 分辨率 + 最高画质下,游戏平均帧数为 99 帧,1% Low 帧 85 帧;
RTX 4070 在 4K 分辨率 + 最高画质下,游戏平均帧数为 78 帧,1% Low 帧 66 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 26.9%,1% Low 帧提升 28.7%。
RTX 5070 在 2K 分辨率 + 最高画质下,游戏平均帧数为 191 帧,1% Low 帧 143 帧;
RTX 4070 在 2K 分辨率 + 最高画质下,游戏平均帧数为 148 帧,1% Low 帧 119 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 29%,1% Low 帧提升 20.1%。
5、《极限竞速:地平线 5》
《极限竞速:地平线 5》游戏优化出色,但对显存的要求并不低,经过实测:
RTX 5070 在 4K 分辨率 + 极端画质下,游戏平均帧数为 116 帧,1% Low 帧 100 帧;
RTX 4070 在 4K 分辨率 + 极端画质下,游戏平均帧数为 91 帧,1% Low 帧 77 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 27.4%,1% Low 帧提升 29.8%。
RTX 5070 在 2K 分辨率 + 极端画质下,游戏平均帧数为 168 帧,1% Low 帧 140 帧;
RTX 4070 在 2K 分辨率 + 极端画质下,游戏平均帧数为 127 帧,1% Low 帧 83 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 32.2%,1% Low 帧提升 68.6%。
6、《黑神话:悟空》
在“众生平等”代表之作《黑神话:悟空》中,开启全景光追后的显卡压力非常大。经过实测:
RTX 5070 在 4K 分辨率 + 超高画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 64 帧,1% Low 帧 51 帧;
RTX 4070 在 4K 分辨率 + 超高画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 52 帧,1% Low 帧 45 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 23%,1% Low 帧提升 13.3%。
RTX 5070 在 2K 分辨率 + 超高画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 99 帧,1% Low 帧 60 帧;
RTX 4070 在 4K 分辨率 + 超高画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 79 帧,1% Low 帧 52 帧;
NVIDIA GeForce RTX 5070 显卡相比 NVIDIA GeForce RTX 4070 显卡的平均帧数提升约 25.3%,1% Low 帧提升 15.3%。
可以看到,NVIDIA GeForce RTX 5070 显卡的 4K 游戏表现确实更加均衡,主流游戏都能在最高或极高画质下跑到 60 帧以上的水平,并且部分游戏的 1% Low 帧也有显著提升,游戏体验更加流畅。而上一代 NVIDIA GeForce RTX 4070 显卡在《黑神话:悟空》这样应用全景光线追踪技术的新游戏中就显得有些力不从心了。
五、DLSS 4 游戏体验
RTX 50 系显卡新增的 DLSS 4 技术在 DLSS 3 的基础上,新增了全新的多帧生成技术,结合第五代 Tensor 核心的强大性能,利用 AI 为每个渲染帧生成至多 3 个额外帧,从而大幅提升游戏的 FPS 水平。
DLSS 4 配合全套 DLSS 技术,包括光线重建、超分辨率以及 DLAA 等功能,最多可实现传统图像渲染的 8 倍帧率。
多帧生成技术还可配合 NVIDIA Reflex 低延迟技术保持较低的游戏延迟,让游戏的操作和响应影响很小。Blackwell 显示引擎也在 DLSS 4 技术中发挥了重要作用,通过提升其像素处理能力,让游戏在更高分辨率和刷新率下满足 DLSS 4 技术的要求,最高可提升 1 倍的像素处理能力。
DLSS 4 技术还带来了模型架构的重大升级,DLSS 光线重建、DLSS 超分辨率和 DLAA 特性均由首个实时 Transformer 模型驱动,并用来提升生成像素的质量,它支持通过自注意力操作评估整个帧几多个帧中每个像素的重要程度,更好理解场景关系,让生成的像素具有更好稳定性、更少的伪影、更丰富的运动细节和平滑边缘。
官方表示,目前已有超过 75 款支持 DLSS 帧生成技术的游戏和应用可在 GeForce RTX 50 系列 GPU 上升级至 DLSS 多帧生成技术,不少主流 3A 大作也已于 50 系显卡正式发售后更新了 DLSS 4 多帧生成功能的支持,包括《心灵杀手 2》、《夺宝奇兵:古老之圈》、《黑神话:悟空》、《星球大战:亡命之徒》《寂静岭 2:重制版》等热门作品。
《赛博朋克:2077》作为首批支持 DLSS 4 技术最完善的游戏之一,如果在 4K 分辨率下开启光追,但不开启 DLSS 和帧生成选项,那么:
在 4K 分辨率超级光追画质下,游戏平均帧数为 21 帧;
在 4K 分辨率超速光追画质下,游戏平均帧数为 5 帧;
即使不开启光追,4K 分辨率下游戏平均帧数也只有 48 帧,在没有 DLSS 和帧生成技术的加持下,基本告别 4K 体验了。
幸好显卡支持 DLSS 4 技术,在游戏中开启 DLSS Multi Frame Generation(DLSS 多帧生成)选项后,游戏帧数的表现瞬间就不一样了。我们依次在 4K 分辨率 + 超级光追画质 + DLSS 质量档设置下,选择 2x、3x 和 4x 多帧生成,运行游戏基准测试,分别得到了 67 帧、94 帧和 119 帧的游戏平均帧数,相比不开 DLSS 时的 21 帧,提升幅度分别达到了 3.19 倍,4.47 倍和 5.66 倍,原本完全无法在 4K 分辨率下畅玩,现在直接可以跑到 4K / 120Hz 了,不得不说 DLSS 4 给了 NVIDIA GeForce RTX 5070 这张显卡在光追游戏上脱胎换骨的体验。
那么多帧生成会影响画质吗?通俗点说就是会不会令画面变得更糊?为此我们也在《心灵杀手 2》中同一个场景截取了 3 种不同画质设置的游戏画面,分别是:
4K 原生画质 + 路径光追;
4K 最高画质 + DLSS 性能档(1080P 渲染)+4x 帧生成
4K 最高画质 + DLAA(4K 渲染)+4x 帧生成
然后通过 NVIDIA ICAT 工具进行比较,在不放大的情况下 3 者根本看不出区别,所以我们挑选了 3 处细节进行放大对比。
首先是警员手臂衣服上的 FBI 标志,左侧和右侧分别是 DLAA(4K 渲染)和原生 4K 画质,中间是 DLSS 性能(1080P 渲染),经过放大可以看到中间图片的 FB 文字更糊一点,但左右基本看不出清晰度上的区别。
同样在警员的波浪卷发以及身旁右侧的树叶上也能看出中间的画面更糊一点,左右两边的图片却难以发现差距。
也就是说对于物理渲染分辨率上的天然鸿沟,DLSS 技术肯定是无法完全弥补画质差距的,但只要保持和原生画质相同的分辨率(即开启 DLAA),画面清晰度和细节几乎没有区别,更别说我们这种“盯帧式”比较有点吹毛求疵,正常游戏无论是 DLSS 性能档(1080P 渲染)还是 DLAA(4K 渲染)都不会有糊成一片,锯齿满满这种明显问题,所以最主要的还是看游戏适配,在乎画质的小伙伴直接开启 DLAA 就好了。
六、创意生产
生产力方面,IT之家实测了 UL Procyon 的图像视频剪辑、以及 AI 文本撰写等性能。
在 UL Procyon 的视频剪辑性能测试项目中,GPU 加速,得益于 Blackwell 架构升级的第九代 NVENC 编码器和 NVDEC 解码器,其在 H.264 / H.265 4:2:2 编码的 8 位和 10 位视频上有着非常大的优势,经过实测:
NVIDIA GeForce RTX 5070 显卡得分 57038 分;
NVIDIA GeForce RTX 4070 显卡得分 48427 分;
NVIDIA GeForce RTX 5070 显卡的视频编辑性能相较 NVIDIA GeForce RTX 4070 显卡提升约 17.7%。
在 UL Procyon AI 推理性能测试项目中的 Microsoft Windows ML 版本测试中:
NVIDIA GeForce RTX 5070 显卡得分 1091 分;
NVIDIA GeForce RTX 4070 显卡得分 989 分;
NVIDIA GeForce RTX 5070 显卡的 Microsoft Windows ML 版本 AI 推理性能提升相较 NVIDIA GeForce RTX 4070 显卡提升了约 10.3%。
在侧重建模和渲染性能的 blender Benchmark 4.3.0 版本基准测试中:
RTX 5070 显卡的 3 个场景分别拿到了 2864 分、1608 分、1506 分;
RTX 4070 显卡的 3 个场景分别拿到了 2554 分,1260 分、1325 分;
在 Blender 基准测试的 3 场景渲染中,NVIDIA GeForce RTX 5070 显卡的渲染性能相较 NVIDIA GeForce RTX 4070 显卡提升分别约为 12.1%、27.6%、13.6%。
七、总结
NVIDIA GeForce RTX 5070 这张显卡的定位更符合主流游戏玩家人群的预算区间和需求,因此它在 4K / 2K 高分辨率 + 高刷显示器配置下的游戏体验至关重要。好在相比上一代 NVIDIA GeForce RTX 4070 显卡,它的 4K / 2K 游戏表现更加游刃有余,主流在线竞技游戏和光栅游戏都能跑到 4K / 60 帧以上的表现。
而光追游戏也能借助 DLSS 3 / DLSS 4 技术,实现游戏性能的飞跃,画质的损失却非常有限,从这点上来说它在一定程度上满足了部分 RTX 5070 Ti 显卡用户的需求,但价格更实在。
另外,DLSS 4 技术的到来也奠定了未来显卡性能的升级方向,通过 AI 来填充像素,以最佳的性能表现呈现给玩家。相信随着新游戏不断加入对 DLSS 4 技术的支持,玩家会成为最大的受益者。至于外观设计和价格方面,对首发党来说完全是可以闭眼买的类型,独一无二的公版设计加上实惠的价格,性价比出众。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。