【IT之家评测室】影驰 GEFORCE RTX 4080 SUPER 金属大师显卡评测:4K 党一步到位的新游戏利器
作为最晚登场的 RTX 40 SUPER 系列显卡,它这次究竟有多大的提升;除了游戏方面,它的专业生产力和 AI 表现又如何?今天咱们就借着这张首发的影驰 GEFORCE RTX 4080 SUPER 金属大师显卡来一探究竟吧。
首先介绍下本次的测试平台:
外观设计
影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的外观初看颇有种金属硬核机甲风的感觉,这也是金属大师系列一贯的设计风格。它的造型方正,正面采用一体压铸铝合金装甲外壳,银白色配合 CNC 高光亮边以及不规则纹理,视觉冲击力很强同时质感在线。
显卡风扇采用了对比强烈的黑色,3 个直径为 102mm,厚度 20mm 的静霜风扇,11 片黑色扇叶的 3 段式结构,能够有效降低风阻,增大风量,且支持智能启停。
显卡一侧有大面积的镂空,可以看到内部的散热鳍片,左右分别印有 GEFORCE RTX 和 GALAX 的标识。
中间的全新的 12VHPWR 供电接口,搭配部分定制线材的电源,只要一根线材就可为显卡供电,安装起来更加方便。
显卡另一侧可以清晰看到内部的散热格栅,官方称之为新一代寒光星散热系统,内部提供了 4*Φ6mm 4*Φ8mm 镀镍复合热管、大面积高效能均热板和鳍片,与表面 3 风扇共同协作,极大提升了散热效能。
显卡背板部分采用了铝合金 + 拉丝金属工艺,左侧图案和右侧出风口借助金属大师 Logo 做成了巧妙的对称效果,GEFORCE RTX 和金属大师图形 Logo 分列中部上下边缘,视觉上非常规整。
输出接口方面配备了 3 个 DP1.4a 接口和 1 个 HDMI2.1 接口,基本是目前显卡的标配了。
配件方面,影驰 GEFORCE RTX 4080 SUPER 金属大师提供了 16pin 转 3*8pin 的供电转接线以及一套可拆卸设计,金属材质的显卡支架。
核心解析
GEFORCE RTX 4080 SUPER 虽然也基于 AD103 核心所打造,但是核心规格方面相当恐怖。比如配备了 10240 个 CUDA 核心,相比 RTX 4080 的 9728 个 CUDA 核心,核心数提升了 5.2%。它还拥有 52 个 Shader Core TFLOPS 单元和 121 个 RT Core TFLOPS,图形 / 游戏性能再次升级。此外,它的 320 个 Tensor Cores 核心和 836 个 AI TOPS 将提供强大的 AI 算力和 DLSS 性能。
显存规格上 GEFORCE RTX 4080 SUPER 还是 16GB GDDR6X,与 RTX 4080 保持一致。不过,64MB 的 L2 缓存,能够让 GEFORCE RTX 4080 SUPER 充分发挥 4K 分辨率下的游戏性能。GPU 频率方面,基础频率为 2295MHz,加速频率为 2550MHz,分别比 RTX 4080 提升了 40MHz 和 80MHz。从显卡规格和官方的定位上看,GEFORCE RTX 4080 SUPER 是一张定位 4K 游戏和拥有强大 AI 算力的高端显卡。
当然,GeForce RTX 4080 SUPER 依旧采用了最新的 NVIDIA Ada 架构,基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器的吞吐量超过上一代产品 2 倍。第三代 RT Cores 的 DLSS 3 可让光追性能提升 2 倍,第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,DLSS 至多提升 4 倍性能。
理论性能
大家都知道,来到 80 这个数字后缀的显卡,功耗都不会太低,毕竟需要为性能兜底,那么它的温度又控制得如何呢?我们不妨通过甜甜圈烤机测试来验证一下。烤机 20 分钟,GPU 功耗保持在 320W 左右,核心温度居然只有 66.4℃左右,显存温度也只有 68℃,而此时 GPU 频率依旧能够跑到 2415MHz,看样子影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的散热做得非常出色,大家放心用就是了。
在 3D Mark 的 TimeSpy 压力测试中,影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的发挥也非常稳定,以 99.6% 的成绩轻松通过测试,毫无压力。
接下来是 GPU 的理论性能表现,在 3DMark TimeSpy Extreme DX12 测试中,影驰 GEFORCE RTX 4080 SUPER 金属大师的显卡分数为 14550 分,相比 RTX 3080 的 8602 分提升了 69% 左右,可以说远超上一代的表现。
在 3DMark Fire Strike Extreme DX11 测试中,影驰 GEFORCE RTX 4080 SUPER 金属大师的显卡分数达到了 34426 分,对比 RTX 3080 的 20382 分提升了约 68.9%,而相比上代 RTX 3090 Ti 的 27074 分,也有 27% 的提升。
在 3DMark Fire Strike Ultra DX11 测试中,影驰 GEFORCE RTX 4080 SUPER 金属大师的显卡分数达到了 17720 分,对比 RTX 3080 的 10365 分提升了约 70.9%,还大幅度超越了上代 RTX 3090 Ti 的 13855 分。
在 3DMark Portal Royal 光追测试中,影驰 GEFORCE RTX 4080 SUPER 金属大师获得了 18509 分,相比 RTX 3080 的 11231 分提升了 64.8%,光追游戏性能提升非常大。
游戏实测
既然说到游戏,就不得不提一下目前 NVIDIA 平台已经拥有超 500 款支持 RTX 技术的游戏和应用,而且随着 DLSS 3 技术的日趋成熟和普及,支持 DLSS 3 的游戏数量也在源源不断地上升。
比如今年 14 款支持 DLSS 3 技术的全新游戏加入,包括《龙之信条 2》《地平线: 西之绝境》《如龙 8》《半条命 2 RTX》等知名游戏。另外,已经发布的《心灵杀手 2》《赛博朋克 2077:往日之影》《使命召唤:现代战争 3》等,也在第一时间就支持了 DLSS 3 或 DLSS 3.5 的技术。与此同时,目前主流的热门在线竞技类游戏,都支持了 NVIDIA Reflex 技术,不管是对于低配玩家还是电竞玩家,这两项技术都能极大提升游戏体验。
接下来的游戏测试环节,我们将给大家测试 6 款游戏,包括 2 款在线竞技类游戏,2 款传统光栅游戏以及 2 款支持 DLSS 3/3.5 的光追游戏,所有游戏均采用 4K 分辨率测试,以此验证它的 4K / 4K 光追游戏表现。
首先是两款在线竞技类游戏,在《CS2》中我们采用默认高画质选项,在 4K 分辨率下进行一局对战,并通过 Frame View 记录平均帧数,影驰 GEFORCE RTX 4080 SUPER 金属大师的平均帧数能够达到 303 帧,4K 电竞不是梦。
另外,通过开启游戏设置中的 NVIDIA Reflex 选项至开启 + 增强,即使来到 4K 分辨率下,游戏的平均延迟也只有 10.6ms,对玩家的影响可以说非常小。
第二款在线竞技类游戏我们选择了人气颇高的《彩虹六号:围攻》,影驰 GEFORCE RTX 4080 SUPER 金属大师在 4K 分辨率,最高画质下的平均帧数达到了 349 帧,也是完全能够满足高分高刷电竞需求的。
至于延迟方面,《彩虹六号:围攻》同样支持 NVIDIA Reflex 技术,在游戏运行时选择带有 Vukan 的选项,就能在游戏中找到 Reflex on + 增强的选项,开启之后通过 Frame 进行抓取,4K 分辨率下的平均延迟也才 12.6ms,延迟表现相当可以。
接着是 2 款传统光栅游戏,在经典叙事冒险游戏《荒野大镖客:救赎 2》中,选择最高画质,4K 分辨率下的平均帧数可以达到平均 100 帧,RTX 4080 为 95 帧,提升了 5.2%。
我们也测了育碧家的最新作《刺客信条:幻景》,在 4K 分辨率最高画质下,运行游戏自带的性能基准测试,影驰 GEFORCE RTX 4080 SUPER 金属大师的平均帧数来到 100 帧,RTX 4080 的平均帧数为 92 帧,提升了约 8.6%。在传统光栅游戏中,RTX 4080 SUPER 相比 RTX 4080 的提升比较有限。
那么在光追游戏中,影驰 GEFORCE RTX 4080 SUPER 金属大师的表现又如何呢?IT之家选择了两款支持 DLSS 3/3.5 的光追游戏,其中一款是优化非常出色的《极限竞速:地平线 5》,在游戏中选择极端画质预设,并开启 DLSS 3 + DLSS 2 质量档,NVIDIA Reflex 选项也会默认打开,我们照例选择 Reflex ON+BOOST,运行游戏自带的性能基准测试。
进入游戏选择 4K 分辨率极端画质,平均帧数可以达到 148 帧,游戏的平均延迟仅为 15.4ms。RTX 4080 的平均帧数是 132 帧,提升约 12.1%。对于一款带有竞技属性的赛车游戏来说,4K 分辨率画质拉满也能跑到 150 帧左右,玩起来是种享受。
那如果我们只开光追,不开 DLSS 选项,且关闭 Reflex 低延迟选项时,影驰 GEFORCE RTX 4080 SUPER 金属大师的表现又如何呢?可以看到在优化出色的地平线 5 中,即使不开 DLSS,4K 光追下平均帧数依旧来到了 125 帧,不过没有 Reflex 低延迟技术的加持,游戏平均延迟飙升到了 24ms。
最后是对显卡性能要求非常高的《赛博朋克:2077》,这次我们测试 3 次,第一次选择超级光追画质,开启 DLSS 2 质量档 + DLSS 3 帧生成,在 4K 分辨率下运行自带基准性能测试,此时平均帧率能到 84 帧,还不错的表现。
第二次我们选择超速光追画质,开启 DLSS 2 质量档 + DLSS 3 帧生成 + DLSS 3.5 光线重构,此时 4K 分辨率下,影驰 GEFORCE RTX 4080 SUPER 金属大师的平均帧数正好 60 帧,算是守住了 4K / 60 帧的底线。
当然,如果完全关闭 DLSS,只开光追,4K 下的游戏平均帧数就只有 28 帧了,毕竟不是所有游戏都能有地平线 5 的优化水平,画质对性能的负载也不同。通过对比不难发现,DLSS 技术对于游戏玩家来说绝对是最实用的技术。
关闭光线重构
开启光线重构
那么开不开 DLSS 3.5 对于游戏画质到底有何影响呢?大家看这两张图,游戏中同一个场景下雨后湿滑路面的倒影给了我们答案,在开启光线重构后倒影的清晰度提升明显,以往画面中常有的伪影也少了很多,显而易见 DLSS 3.5 可以说是高等级光追的润滑剂,在保留最高画面效果的同时,也能发挥最好的帧数表现。
不过游戏表现我们不能只看平均帧,还要看看这张显卡运行主流游戏时的功耗如何,所以IT之家也帮大家统计影驰 GEFORCE RTX 4080 SUPER 金属大师显卡在 4K 分辨率下的游戏平均功耗,6 款游戏中《赛博朋克:2077》一骑绝尘,飙到了 290W 的功耗,而彩虹 6 号围攻的 4K 似乎也没优化好,271W 的功耗比较高了,其余 4 款游戏的功耗均在 240W 以下,面对满载 320W 功耗的 RTX 4080 SUPER,完全不用担心带不动。
创意生产
前面我们曾提到,GeForce RTX 4080 SUPER 的 L2 缓存也达到了 64MB,显存带宽高达 23Gbps,还有多达 836 个 AI TOPS 核心,这为 GEFORCE RTX 4080 SUPER 的创意生产和 AI 性能提供了有力保障。用户还可通过安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意应用,如 Optix、DLSS 和 Maxine,还有 NVIDIA Studio 全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
在建模和渲染类软件中,GeForce RTX 4080 SUPER 的 10240 个 CUDA 核心可以提供硬件加速,使得工作效率得以提高。几乎所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光线追踪功能,实现高性能的最终帧渲染。此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,提供更加流畅的工作体验。
实际看一下影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的专业生产力表现。首先是 V-Ray Benchmark 这款建模软件的基准测试部分,GPU CUDA 测试项目得分为 3107 分。
在 GPU RTX 的测试项目中,影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的最终成绩为 4314 分。
在另一款建模软件 blender 的 Benchmark 测试中,影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的三场景得分如图所示,三场景得分则是 4543,2138,2212,同样有明显提升。
接着咱们看看它在视频渲染和编解码方面的性能表现,GEFORCE RTX 4080 SUPER 配备了 2 个 NVENC 编码器,且支持新一代 AV1 视频编码技术,相同视频大小下能够提供更加快速的视频编码和更高质量的流媒体传输性能。国内的剪映专业版已经实现了对 NVIDIA AV1 视频编码器的加速支持,我们也对此进行了测试,在剪映专业版中导入一段时长为 2 分 30 秒的 4K 视频素材,然后分别采用 H.264 编码和 AV1 编码进行导出。
可以看到同样导出 4K / 60 帧规格的情况下,AV1 编码导出的视频大小为 609MB,H.264 编码导出的视频大小为 800MB,文件体积上采用 AV1 编码的视频相比 H.264 编码的视频小了近三分之一。
而且在画质方面,通过截取两个视频的画面细节进行观察,两种编码方式也基本看不出任何区别,又小又高清,AV1 势必会成为编码格式中的新宠。
还有就是 RTX 视频超分辨率技术,它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现以算法提高清晰度的效果。我们只需在 NVIDIA 控制面板中找到视频 —— 调整视频图像设置,便可以自定义调节,超分等级有 4 档。
↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4
我们通过播放在IT之家B站账号发布的一条视频,并将分辨率调整为 480P,然后依次提升超分等级进行截图测试,能看出 1-4 档下人物变得更加清晰了。
最后我们还通过 Stable Diffusion 简单测试了一下这张卡在 AIGC 方面的表现,模型我们采用了基于 SDXL 开源模型的 sd_xl_base_1.0_0.9vae.safetensors,以文生图的方式绘制 21 张动漫少女的图像,图像分辨率为 1024*1024,采样方法为 Euler a,迭代步数 50,总批次数为 10,最终花费 1 分 58.5 秒完成。
第二次我们在其它设置不变的情况下,打开 TensorRT Engines 优化引擎后再跑一遍,这次时间紧紧花费了 1 分 07 秒,节省了近一半。
总结
影驰 GEFORCE RTX 4080 SUPER 金属大师这款显卡在实际测试中的表现非常给力,无论是借助 DLSS 技术的 4K 光追游戏体验,4K 游戏功耗表现,还是 AI 性能和专业生产力表现,都做到了无可挑剔,可以说是当下各方面表现都均衡水桶的高端旗舰卡。再加上这次官方价格也颇具诚意,相比 RTX 4080 首发立减 1400 元的操作,让它显得更香。
其实作为普通玩家,影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的性能显然有些溢出,比如追求 2K 游戏的玩家,完全可以选择价格更便宜的 RTX 4070 SUPER,毕竟 8099 元的价格还是非常考验钱包的。好在影驰 GEFORCE RTX 4080 SUPER 金属大师显卡的外观设计和做工都很在线,对于追求高颜值装机的用户,它也不失为一个出色的选择。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。