【IT之家评测室】NVIDIA GeForce RTX 4070 评测:DLSS 3 加持的狂暴性能小钢炮

2023-04-12 21:00IT之家 - 如舟

众所周知,NVIDIA GeForce RTX 40 系列 GPU 由于升级了架构和制程,所以能效比有了不小的提升。但由于之前发布的高端卡,普遍性能也提升了不少,所以功耗相对来说也是不低的。而真正让笔者直观的感受到 Ada 架构带来的能效比飞跃的,正是我们今天的主角 GeForce RTX 4070,不仅体积更小,性能也有了突飞猛进的提高。2K 分辨率下可满足 100 帧以上畅玩光追游戏。

IT之家也是提前收到了公版的 NVIDIA GeForce RTX 40 系列 GPU,在本次测试中,我们将使用一套高配 intel 配置来测试,尽量避免显卡瓶颈。具体配置如下:

外观设计

NVIDIA GeForce RTX 4070 的包装沿用了之前高端显卡的设计,给人一种“速度穿越”的感觉,但巨大的包装内,显卡却变得相当小巧。

显卡本体为标准的 2 槽设计,长度也只有 24cm 左右,整体设计方正紧凑。即便是 A4 结构的 ITX 机箱也可以轻松装下。

显卡的背板设计依旧延续了公版显卡的 X 型设计,金属风满满,低调不失炫酷。

正面则是厚实的散热鳍片,整张显卡全金属的设计也有利于散热。

显卡风扇采用一左一右一上一下的独特排布方式,能形成垂直风道,更好地带走鳍片上的热量。

显卡外围环绕着一层银灰色的全金属包边,上方印有醒目的 GeForce RTX 标识。

螺丝接口被设计在了右侧,整卡的一体感很强。

供电方面,它采用最新的 ATX3.0 规范的 16Pin 供电接口,随包装内附赠了 2*8Pin 转 16Pin 的转接头,事实上,它的 TGP 功耗仅 200W 左右,理论上单 8Pin 的供电也能带动。我们在装机时,最好使用支持 ATX 3.0 规范的电源,这样可以让机箱内更美观。如果一定要用转接线的话,用一根一分二 8Pin 的线就可以了。

I / O 接口挡板采用深灰配色,接口方面配备了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 输出。

接口方面,NVIDIA GeForce RTX 4070 依旧是 PCIe 4.0 的接口,搭配主流主板均可释放全部性能。

核心解析

RTX 4070 与 RTX 4070Ti 相似,都是基于 AD104 核心打造的,但细节有所不同。具体的核心代号为 AD104-250。里面完整的 GPC 从 5 组变成了 4 组,内部共有 5888 个 CUDA 核心、184 个 Tensor 核心、46 个第三代 RT 核心和 64 个 ROP 单元,基本上可以理解为保留了 RTX 4070 Ti 80% 的核心规模。不过招牌的 NVENC 单元从两个变成了一个。这意味着它的视频编码能力是不如 RTX 4070 Ti 及以上的显卡的,但相比于上一代 RTX 3070 和 RTX 3070 Ti 则要强非常多。

RTX 4070 的 BOOST 频率是 2475MHz,默认频率为 1920MHz。显存方面与 RTX 4070 Ti 保持一致。都是 192-bit 位宽的 12GB GDDR6X,带宽也都是 21Gbps。从上述定位中我们可以看出,RTX 4070 与 RTX 4070 Ti 一样,都是一张定位 2K 高帧率游戏的中高端显卡。

当然,GeForce RTX 4070 依旧采用了最新的 NVIDIA Ada 架构,基于 TSMC 4N NVIDIA 定制工艺打造,从而实现了高达 2 倍的性能功耗比飞跃。它的流式多处理器吞吐量超过上一代产品的 2 倍,第三代 RT Cores 的光线追踪计算能力更是提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具备高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。而 SER 技术为光线追踪带来了最高可达 3 倍的性能提升,整体游戏性能也可高达 25% 的提升。

新的 Ada 架构在具体功能上带来了许多新的特性:引入了光流加速器使得 DLSS 3 能够预测场景中帧与帧之间的运动变化,从而通过 AI 实现了帧生成技术,提高了帧率的同时保持图像质量。此外,新架构还支持 AV1 编码器的应用,从而降低了视频的体积,并获得更好的画质。同时,RTX VSR 功能的应用也使得实时视频超分辨率成为可能。

理论性能

我们在标题就有说到,RTX 4070 的功耗非常低。具体能有多低呢?我们单烤甜甜圈测试一下就知道了。烤机 15 分钟后,核心温度稳定在 66.4℃左右,显存温度约 80℃。整卡功耗仅仅 198W,甚至比 RTX 3070 还更低。如果电源不虚标,CPU 配个 i5、R5 之类的百瓦 CPU,只要 450W 的电源都能带动整机了。最关键的是,它仅需单根 8Pin 一分二输出线就可以正常使用(一些非公显卡甚至有单 8Pin 版本),这意味着有升级想法的玩家们,完全不需要换电源。由于显卡体积特别小,机箱也不用换了。

接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测 NVIDIA GeForce RTX 4070 的得分为 99.6%,性能释放极其稳定。

在 3DMark TimeSpy DX12 测试中,显卡分数达到了 18140 分,这个成绩已经超越了 RTX 3080 10G,与 RTX 3080 12G 是基本相当的,可以说 RTX 4070 的 DX12 性能约等于 RTX 30 系列的高端显卡了,而功耗却仅仅只有一半。

在 3DMark FireStrike Extreme DX11 测试中,NVIDIA GeForce RTX 4070 显卡分数达到了 21497 分,同样与 RTX 3080 12G 相近,而功耗却小了 50%。

而在 3DMark Portal Royal 光追测试中,NVIDIA GeForce RTX 4070 获得了 11116 分,说明其光追能力约等于 RTX 3080 10G,也是能畅玩光追 2K 游戏的水平。

游戏实测

接下来,我们就进行一下游戏实测。值得一提的是,目前十大主流竞技射击游戏中随着《反恐精英 2》的加入,现已有九款支持 NVIDIA Reflex,这些游戏包括:《Apex 英雄》,《使命召唤: 战区 2》,《命运 2》,《逃离塔科夫》,《堡垒之夜》,《守望先锋》”归来”,《彩虹六号:围攻》和《无畏契约》,NVIDIA Reflex 能缩减操作延迟,提高响应速度,让跟枪更灵敏。笔者希望即将更新起源 2 版本的 CS2,也能支持 NVIDIA Reflex 技术。

接下来笔者测试了两款经典 3A 大作。《荒野大镖客 2: 救赎》在不开启 DLSS 的情况下,GeForce RTX 4070 能达到平均 103.6 帧,已经能满足 2K 100 帧以上高帧畅玩了,这个体验无疑是非常出色的。

如果我们开启质量档的 DLSS,帧数会进一步提升到平均 119 帧,并且此时画质几乎没有损失,体验很出色。

在另一款经典的 3A 大作《古墓丽影: 暗影》中,我们也得到了类似的答案。在 2K 最高画质下运行自带的 BenchMark,已经能达到平均 174 帧,满足 2K165Hz 屏幕的畅玩。

在开启 DLSS 后,帧数表现更佳,能达到平均 206 帧,帧数提升了 30 多帧。总的来说,RTX 4070 在传统 3A 大作中的表现是很接近 RTX 3080 的。更别说前代同级的 RTX 3070 Ti、RTX 3070 了。

以上这些只是开胃小菜,而 RTX 4070 的最吸引人之处在于其 DLSS 3 技术,可进一步提升帧率。DLSS 3 是一款由 AI 驱动的性能倍增技术,采用了全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,同时具备开创性的光学多帧生成功能,将为 NVIDIA RTX 神经网络渲染游戏和应用开启新的时代。

简单来说,过去的 DLSS 2 技术是通过渲染一个低分辨率图像,然后通过 AI 放大至高分辨率,从而提升画质和帧率。而全新的 DLSS 3 技术在兼容 DLSS 2 的基础上,新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出的全新帧,从而实现帧率的倍增。同时,结合 DLSS 2 的超分辨率功能,AI 能够重建多达八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!

目前已经有超过 280 款 DLSS 游戏和应用发布。其中共有 30 款已发布的 DLSS 3 游戏。从发布进度来看,在 DLSS 2 和 DLSS 3 各自发布的前六个月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍。看来适配难度是相当低的,相信将来有越来越多的游戏适配 DLSS 技术。

我们先来看看压力最大的《赛博朋克 2077》在光追 + 2K 分辨率下的帧数情况,在默认状态下,RTX 4070 还是没有办法畅玩的,平均帧数约 38 帧。如果开启 DLSS 2 质量,帧数就可以达到平均 69 帧畅玩了。而如果开启 RTX 40 系列专享的黑科技 DLSS 3,瞬间暴涨到了平均 103 帧,同时能满足观感和流畅。

传奇 3A 大作《巫师 3:狂猎》最近也更新了次世代版,配置要求大大提高,当然画质也跟上了潮流,放在如今也毫不落伍。同时它也提供了 DLSS 3 技术的支持,这对于 RTX 40 系列显卡无疑是一个好消息。

《巫师 3:狂猎》次世代版在 2K 分辨率不开启 DLSS 的情况下,GeForce RTX 4070 平均仅有 38 帧,如果开启质量档 DLSS 2,就可以达到平均 64 帧。如果开启 AI 加持的 DLSS 3 技术,帧数就能暴涨到平均 95 帧,大部分场景可以实现 2K 百帧畅玩了。

在另一款画质爆炸的次世代 3A 大作《瘟疫传说:安魂曲》中,优化相对来说就要好不少了。即便不开启任何 AI 技术,也可以满足 2K 60 帧流畅游玩,而在 DLSS 3 加持后更是可以以电竞帧数畅玩。

实测 RTX 4070 在 2K 分辨率就已经能满足 71.2 帧畅玩了。如果开启 DLSS 2 质量档,就能达到平均 104.5 帧,如果开启 DLSS 3 插帧后,帧数更是会暴涨到平均 147.2 帧,满足 2K144 高刷显示器的需求。

那么,代与代之间的 GPU 会有多大的提升呢?笔者这套配置换上 RTX 3070 Ti 测试了一套数据,看看隔代之间性能会有多少提升,在 DLSS 3 技术的加持下又会有多少提升。实测不开启 DLSS 3 的情况下,RTX 4070 大约有 10% 的帧数优势。如果开启 RTX 4070 系列独占的 DLSS 3 技术,帧数则领先了约 70%,这就是 AI 技术的魅力呀。

前面我们有提到过,RTX 4070 的功耗是相当低的,实际上一根 8Pin 供电就能带动。因此我们还使用英伟达官方的 FrameView 工具统计了一下各个 3A 大作中的平均功耗。可以看出,大部分 3A 大作中 RTX 4070 的实际功耗都在 160-190W 左右,如此低的功耗,意味着电源的选择上就很宽裕了,预算又可以省下一大笔,或许会成为万元机器的新选择。而 ITX 爱好者们或许可以期待一下单风扇的 RTX 4070 小卡了。

创意生产

显存规模上,NVIDIA GeForce RTX 4070 与 RTX 4070Ti 的规格完全一致,都拥有 12G 的大显存,速度也达到了 21Gbps。因此也被赋予了一定的创意生产能力。因此该显卡还支持安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意应用。专有的 SDK 能使这些应用的运行速度更快,并提供独家功能,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。同时大显存的加持也让它具备了一定的生成式人工智能的运算能力,拿来进行简单的 AI 绘画训练也是没有问题的。

在建模和渲染类软件中,NVIDIA GeForce RTX 4070 的 5888 个 CUDA 核心可以提供硬件加速,使得工作效率得以提高。几乎所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光线追踪功能,实现高性能的最终帧渲染。此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,提供更加流畅的工作体验。

我们也实测了一下 V-Ray Benchmark 的性能表现,GeForce RTX 4070 获得了 1847 分,可以应对大部分中等规模的建模渲染需求。

得益于光追性能的提升,GeForce RTX 4070 在 V-Ray GPU RTX 中的分数也提高到了 2631 分,也能应付一些中等负载的光追建模渲染需求。

在视频后期这一块,GeForce RTX 4070 同样配备了 NVENC 编码器。并且 RTX 4070 也支持下一代视频编码技术 AV1,AV1 能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。随着各大视频平台希望节约服务器流量费用,AV1 编码必将成为未来的主流编码方式。

NVIDIA 与多家行业合作伙伴密切合作,确保其 GPU 能够充分支持当今主流的多媒体应用。目前,国内的剪映专业版已经实现了对 NVIDIA AV1 视频编码器的加速支持。而常用的视频调色剪辑软件 DaVinci 也提供了 AV1 编码的支持。这意味着 NVIDIA GPU 将来一定可以在处理视频编辑和渲染任务时充分发挥其 AV1 加速功能,提供更高效的性能和更流畅的工作体验。

IT之家还为大家测试了 PugetBench For Adobe 全家桶,看看它能否胜任视频剪辑工作。实测 GeForce RTX 4070 在创意工作者们常用的 Adobe Premiere 中,我们开启 GPU Cuda 加速,然后使用 PugetBenchmark 进行测试。最终得分为 1475 分,浏览时间线上的 4K 视频毫无压力。

另外一款压力更大的视频特效软件 Adobe Effects 中,我们同样使用 PugetBenchmark 进行测试。最终得分为 1640 分,能用来制作一些比较复杂的视效。

除了内容生产以外,在内容消费领域 RTX 4070 也有新功能。那就是 RTX VSR 技术。全称为 RTX Video Super Resolution(RTX 视频超分辨率技术)。它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,目前这一技术已经适配了 Chrome 浏览器和 Edge 浏览器,后续也会适配以 VLC 为首的本地播放器。

RTX 视频超分辨率的使用非常简单,只要将 RTX 30 系列 / 40 系列的驱动程序更新到 531.14 以上版本,并将 Chrome / Edge 浏览器也更新到最新版本便可以启用。启用路径为:NVIDIA 控制面板 —— 视频 —— 调整视频图像设置。此选项框下有四个档位可选。档位越高超分辨率效果更明显,但也会消耗更多的 GPU 资源。目前它已支持国内的主流视频平台(哔哩哔哩、爱奇艺、斗鱼和虎牙等平台),以及一些国外的视频平台(Youtube、Twitch、Netflix、Hulu 和 Disney+)。

在下面的测试中,我们播放一条IT之家在哔哩哔哩发布的视频,分辨率调整为 480P,从最左边的原生 480P 分辨率超分后,后面的 1-4 档能看出更加清晰了,实际观感媲美 4K。

↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4

除了 Edge 和 Chrome 浏览器以外,知名的 VLC 本地播放器也在 Beta 版中提供了 RTX VSR 技术的适配。和网页一样,只要在驱动控制面版中打开就可以了。我们用一个 480P 的本地视频做演示,明显感觉右边更清晰了,后面大家欣赏本地电影时,也可以用这个技术进一步优化画质。

在最近大火的 AI 绘画(生成式 AI)中,RTX 4070 也有一战之地。例如我们运用 stable-diffusion 的 v2-1_768-ema-pruned.ckpt 模型,尝试绘制 20 张 AI 老黄的图像,RTX 4070 共计用时 2 分 18 秒。

而 RTX 3070 Ti 这边,则用时 2 分 57 秒,相比于 RTX 4070 的出图速度差距是相当明显的。如果平时只是想简单玩玩 AI 的话,RTX 4070 就足以胜任了。当然如果要复杂的研究的话,那还是上 RTX 4090 或更高的 GPU 吧。

总结

笔者对于小而强大的东西一直没有抵抗力,而 NVIDIA GeForce RTX 4070 正是这样一张如此小,又如此强大的小钢炮。它的体积和功耗都比 RTX 3080 低 50% 左右,但性能却非常接近。同时 DLSS 3、RTX VSR 等一系列 AI 技术的加持,能满足 2K 100+ 帧的畅玩,是一张很适合 RTX 3070、RTX 2070Super 这个档位的玩家升级的一张卡。

如果你打算装一台紧凑型主机的话,那么公版的 NVIDIA GeForce RTX 4070 几乎是现在最好的选择,首发的其它非公版 RTX 4070 都没有体积这么小的。这张显卡将于 4 月 12 日晚发售,建议零售价 4799 元,感兴趣的话可以关注一下。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享