【IT之家评测室】NVIDIA GeForce RTX 4080 SUPER 首发评测:性能更强悍,价格更美丽

2024-02-04 15:12IT之家 - 水水

终于,最后一张 RTX 40 SUPER 系显卡它来了,主打 4K 高刷游戏体验,并且首发价相比 RTX 4080 直降 1499 元,也就是 8099 元。如果你最近正好有升级或装机需求,预算充裕且希望各方面表现均衡,一步到位。那么今天这期 NVIDIA GeForce RTX 4080 SUPER 显卡的评测内容一定能帮到你。

评测之前,按照惯例先来介绍一下本次的测试平台,具体配置如下:

外观设计

这次公版卡所有型号都改成了黑色涂装,可以说是外观上最大的变化。也正因为这个细节的区别,使得新版 NVIDIA GeForce RTX 4080 SUPER 的外观更加帅气。

开箱公版卡本身也是一件令人兴奋的事,包装做的非常精致,把它如上图这样放在桌面时,说是一个金属科技感满满的“摆件”也不为过。

NVIDIA GeForce RTX 4080 SUPER 的正面依旧采用 X 型设计,还有占据几乎一半面积的超大风扇,左侧的 RTX 4080 SUPER 型号文字分别采用阴刻和阳刻处理,实际观感颇为精致。不过尺寸上变成了一张 3.5 槽卡,因此体积比较大,重量也增加了不少,即使装机时还是建议大家上显卡支架。

右侧的散热鳍片和风扇均采用全黑化处理,拿在手里很有分量,也有利于更高效地散热。

同样的,背部左侧也有一个一模一样的风扇,彼此能够形成垂直风道,更好带走显卡内部的热量。

NVIDIA GeForce RTX 4080 SUPER 显卡的侧面也同样做了黑化处理,视觉上非常统一,中间还微微做了一点凹陷弧度处理,增强质感。供电接口采用 12+4pin 设计,供电更加稳定。

I / O 接口挡板采用深灰配色,接口方面配备了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 输出。

配件方面,NVIDIA GeForce RTX 4080 SUPER 配备了一条 16pin 转 3*8pin 的转接线,对电源的兼容性更好。

核心解析

GeForce RTX 4080 SUPER 虽然也基于 AD103 核心所打造,但是核心规格方面相当恐怖。比如配备了 10240 个 CUDA 核心,相比 RTX 4080 的 9728 个 CUDA 核心,核心数提升了 5.2%。它还拥有 52 个 Shader Core TFLOPS 单元和 121 个 RT Core TFLOPS,图形 / 游戏性能再次升级。此外,它的 320 个 Tensor Cores 核心和 836 个 AI TOPS 将提供强大的 AI 算力和 DLSS 性能。

显存规格上 GeForce RTX 4080 SUPER 还是 16GB GDDR6X,与 RTX 4080 保持一致。不过,64MB 的 L2 缓存,能够让 GeForce RTX 4080 SUPER 充分发挥 4K 分辨率下的游戏性能。GPU 频率方面,基础频率为 2295MHz,加速频率为 2550MHz,分别比 RTX 4080 提升了 40MHz 和 80MHz。从显卡规格和官方的定位上看,GeForce RTX 4080 SUPER 是一张定位 4K 游戏和拥有强大 AI 算力的高端显卡。

当然,GeForce RTX 4080 SUPER 依旧采用了最新的 NVIDIA Ada 架构,基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器的吞吐量超过上一代产品 2 倍。第三代 RT Cores 的 DLSS 3 可让光追性能提升 2 倍,第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,DLSS 至多提升 4 倍性能。

理论性能

测试性能之前,我们不妨通过甜甜圈烤机测试,来看看它的功耗表现如何。烤机 20 分钟,GPU 功耗保持在 320W 左右,核心温度 69℃左右,显存温度 70℃,这个温度表现还是比较均衡的,而此时的 GPU 频率可以来到 2325MHz-2450MHz 之间,性能释放还是有保障的。

烤机之后,我们又对 GeForce RTX 4080 SUPER 进行了 3D Mark 的 Time Spy 压力测试,来看看在连续高负载下的显卡性能释放是否平稳和持久,最终 GeForce RTX 4080 SUPER 得到了 99.6% 的成绩,持续的性能输出表现非常出色。

接下来是 GPU 理论性能测试环节,在 3DMark TimeSpy Extreme DX12 测试中,GeForce RTX 4080 SUPER 的显卡分数为 14401 分,相比 RTX 3080 的 8602 分提升了 67.4% 左右,也超越了上一代 RTX 3090。

在 3DMark Fire Strike Extreme DX11 测试中,GeForce RTX 4080 SUPER 的显卡分数为 34894 分,对比 RTX 3080 的 20382 分提升了约 71.2%,而相比上代 RTX 3090 Ti 的 27074 分,也有 28.8% 的提升。

在 3DMark Fire Strike Ultra DX11 测试中,GeForce RTX 4080 SUPER 的显卡分数达到了 17395 分,对比 RTX 3080 的 10365 分提升了约 67.8%,也领先于上代 RTX 3090 Ti 的 13855 分。

在 3DMark Portal Royal 光追测试中,GeForce RTX 4080 SUPER 获得了 18439 分,相比 RTX 3080 的 11231 分提升了 64.1%,光追游戏性能提升明显。

游戏实测

既然说到游戏,就不得不提一下目前 NVIDIA 平台已经拥有超 500 款支持 RTX 技术的游戏和应用,而且随着 DLSS 3 技术的日趋成熟和普及,支持 DLSS 3 的游戏数量也在源源不断的上升。

比如今年 14 款支持 DLSS 3 技术的全新游戏加入,包括《龙之信条 2》《地平线: 西之绝境》《人中之龙 8》《半条命 2 RTX》等知名游戏。另外,已经发布的《心灵杀手 2》《赛博朋克 2077:往日之影》《使命召唤:现代战争 3》等,也在第一时间就支持了 DLSS 3 或 DLSS 3.5 的技术。与此同时,目前主流的热门在线竞技类游戏,都支持了 NVIDIA Reflex 技术,不管是对于低配玩家还是电竞玩家,这两项技术都能极大提升游戏体验。

接下来的游戏测试环节,我们将给大家测试 6 款游戏,包括 2 款在线竞技类游戏,2 款传统光栅游戏以及 2 款支持 DLSS 3/3.5 的光追游戏,所有游戏均采用 4K 分辨率测试,以此验证它的 4K / 4K 光追游戏表现。

首先是两款在线竞技类游戏,在《CS2》中我们采用默认高画质选项,在 4K 分辨率下进行一局对战,并通过 Frame View 记录平均帧数,GeForce RTX 4080 SUPER 在 4K 分辨率的平均帧数能够达到 305 帧。

另外,通过开启游戏设置中的 NVIDIA Reflex 选项至开启 + 增强,即使来到 4K 分辨率下,游戏的平均延迟也只有 9ms,对玩家的影响可以说非常小。

第二款在线竞技类游戏我们选择了人气颇高的《彩虹六号:围攻》,GeForce RTX 4080 SUPER 在 4K 分辨率,最高画质下的平均帧数达到了 350 帧,也是完全能够满足高分高刷电竞需求的。

至于延迟方面,《彩虹六号:围攻》同样支持 NVIDIA Reflex 技术,在游戏运行时选择带有 Vukan 的选项,就能在游戏中找到 Reflex on + 增强的选项,开启之后通过 Frame 进行抓取,4K 分辨率下的平均延迟也才 10.2ms,延迟表现相当可以。

接着是 2 款传统光栅游戏,在经典叙事冒险游戏《荒野大镖客:救赎 2》中,选择最高画质,4K 分辨率下的平均帧数可以达到平均 99 帧,RTX 4080 为 95 帧,提升了 4.2%。

我们也测了育碧家的最新作《刺客信条:幻景》,在 4K 分辨率最高画质下,运行游戏自带的性能基准测试,GeForce RTX 4080 SUPER 的平均帧数来到 100 帧,RTX 4080 的平均帧数为 92 帧,提升了约 8.6%。从测试结果不难看出,在传统光栅游戏中,RTX 4080 SUPER 相比 RTX 4080 的提升比较有限。

那么在光追游戏中,GeForce RTX 4080 SUPER 的表现又如何呢?IT之家选择了两款支持 DLSS 3/3.5 的光追游戏,其中一款是优化非常出色的《极限竞速:地平线 5》,在游戏中选择极端画质预设,并开启 DLSS 3 + DLSS 2 质量档,NVIDIA Reflex 选项也会默认打开,我们照例选择 Reflex ON+BOOST,运行游戏自带的性能基准测试。

进入游戏选择 4K 分辨率极端画质,平均帧数可以达到 149 帧,游戏的平均延迟仅为 16.4ms。RTX 4080 的平均帧数是 132 帧,提升约 12.8%。

那如果我们只开光追,不开 DLSS 选项,且关闭 Reflex 低延迟选项时,GeForce RTX 4080 SUPER 的表现又如何呢?可以看到在优化出色的地平线 5 中,即使不开 DLSS,4K 光追下平均帧数依旧来到了 125 帧,不过没有 Reflex 低延迟技术的加持,游戏平均延迟飙升到了 24.1ms。

最后是对显卡性能要求非常高的《赛博朋克:2077》,这次我们测试 3 次,第一次选择超级光追画质,开启 DLSS 2 质量档 + DLSS 3 帧生成,在 4K 分辨率下运行自带基准性能测试,此时平均帧率能到 83 帧,还不错的表现。

第二次我们选择超速光追画质,开启 DLSS 2 质量档 + DLSS 3 帧生成 + DLSS 3.5 光线重构,此时 4K 分辨率下,GeForce RTX 4080 SUPER 的平均帧数正好 60 帧,算是守住了 4K / 60 帧的底线。

当然,如果完全关闭 DLSS,只开光追,4K 下的游戏平均帧数就只有 29 帧了,毕竟不是所有游戏都能有地平线 5 的优化水平,画质对性能的负载也不同。通过对比不难发现,DLSS 技术对于游戏玩家来说绝对是最实用的技术。

关闭光线重建

开启光线重建

那么开不开 DLSS 3.5 对于游戏画质到底有何影响呢?大家看这两张图,游戏中同一个场景下雨后湿滑路面的倒影给了我们答案,在开启光线重建后倒影的清晰度提升明显,以往画面中常有的伪影也少了很多,显而易见 DLSS 3.5 可以说是高等级光追的润滑剂,在保留最高画面效果的同时,也能发挥最好的帧数表现。

创意生产

前面我们曾提到,GeForce RTX 4080 SUPER 的 L2 缓存也达到了 64MB,显存带宽高达 23Gbps,还有多达 836 个 AI TOPS 核心,这为 GeForce RTX 4080 SUPER 的创意生产和 AI 性能提供了有力保障。用户还可通过安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意应用,如 Optix、DLSS 和 Maxine,还有 NVIDIA Studio 全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。

在建模和渲染类软件中,GeForce RTX 4080 SUPER 的 10240 个 CUDA 核心可以提供硬件加速,使得工作效率得以提高。几乎所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光线追踪功能,实现高性能的最终帧渲染。此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,提供更加流畅的工作体验。

实际看一下 GeForce RTX 4080 SUPER 的专业生产力表现。首先是 V-Ray Benchmark 这款建模软件的基准测试部分,GPU CUDA 测试项目得分为 3103 分。

在 GPU RTX 的测试项目中,GeForce RTX 4080 SUPER 显卡的最终成绩为 4292 分。

在另一款建模软件 blender 的 Benchmark 测试中,GeForce RTX 4080 SUPER 显卡的三场景得分如图所示,三场景得分则是 4574,2162,2264,同样有明显提升。

接着咱们看看它在视频渲染和编解码方面的性能表现,GeForce RTX 4080 SUPER 配备了 2 个 NVENC 编码器,且支持新一代 AV1 视频编码技术,相同视频大小下能够提供更加快速的视频编码和更高质量的流媒体传输性能。国内的剪映专业版已经实现了对 NVIDIA AV1 视频编码器的加速支持,我们也对此进行了测试,在剪映专业版中导入一段时长为 2 分 30 秒的 4K 视频素材,然后分别采用 H.264 编码和 AV1 编码进行导出。

可以看到同样导出 4K / 60 帧规格的情况下,AV1 编码导出的视频大小为 609MB,H.264 编码导出的视频大小为 800MB,文件体积上采用 AV1 编码的视频相比 H.264 编码的视频小了近三分之一。

而且在画质方面,通过截取两个视频的画面细节进行观察,两种编码方式也基本看不出任何区别,又小又高清,AV1 势必会成为编码格式中的新宠。

还有就是 RTX 视频超分辨率技术,它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现以算法提高清晰度的效果。我们只需在 NVIDIA 控制面板中找到视频 —— 调整视频图像设置,便可以自定义调节,超分等级有 4 档。

↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4

我们通过播放在IT之家B站账号发布的一条视频,并将分辨率调整为 480P,然后依次提升超分等级进行截图测试,能看出 1-4 档下人物变得更加清晰了。

最后我们还通过 Stable Diffusion 简单测试了一下这张卡在 AIGC 方面的表现,模型我们采用了基于 SDXL 开源模型的 sd_xl_base_1.0_0.9vae.safetensors,以文生图的方式绘制 21 张雪山上的女孩图像,图像分辨率为 1024*1024,采样方法为 Euler a,迭代步数 50,总批次数为 10,最终花费 1 分 55 秒完成。

第二次我们在其它设置不变的情况下,打开 TensorRT Engines 优化引擎后再跑一遍,这次时间仅仅花费了 1 分 01 秒,节省了近一半。

另外,在 Stable Diffusion 跑图时查看显存的占用情况,即使是目前评测中较为简单的绘图参数设置情况下,8GB 显存占用也是常态,瞬时显存占用还会飙到 10GB\12GB 以上,更别提分辨率更高,参数设置更复杂的绘图条件了。如果这张卡的显存只有 8GB,那么对于专业 AI 创作者来说,爆显存很可能经常发生,一旦显存不够出图时间便会大大延长,非常耽误事情。所以 GeForce RTX 4080 SUPER 的 16GB 大显存在 AI 方面起到了非常重要的作用,它和 AI 内容生成的效率直接挂钩,相同架构和近似性能下,显存越大越有优势。

总结

和之前我们评测的 GeForce RTX 4070 SUPER 相比,这张 GeForce RTX 4080 SUPER 显然是瞄准了追求 4K 极致游戏体验的用户,也就是主流游戏全画质特效也能达到 4K 100FPS 的游戏性能,玩家无需在游戏画质和特效中取舍纠结,尽情享受游戏就好。还在用 RTX 40 系以前老卡的用户,想要一步到位的游戏体验可以闭眼买。不过,如果你手上已经有任何一张 RTX 40 显卡,那么升级显卡的周期都可以往后延。除此之外,有 AIGC 创作或者其它 AI 需求的用户,也可以考虑这张卡,目前来说,它也是最适合做 AI 相关工作的。

另一方面,公版 GeForce RTX 4080 SUPER 出色的做工和质感,独特的外形设计,也是很多玩家追捧的原因之一。更别说这次首发价格比原版 RTX 4080 整整便宜了 1400 元。有趣的是,如果我们对比上一代 RTX 3080Ti,那么你会发现两者的 CUDA 核心,Tensors Cores,RT Cores 的数量都是一样的,但是因为采用了 Ada Lovelace 架构,各方面表现都强很多,功耗甚至也要低上 30W。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享