电脑装配网

英伟达 GeForce RTX 4090 首发评测:DLSS 3 帧数暴涨 ‏‏4 倍

 人阅读 | 作者xiaofeng | 时间:2023-09-20 23:06

‏每次 NVIDIA 发布新一代的显卡,总会在玩家群体中引起轰动。一方面是核心性能的提升往往突飞猛进,更重要的是每次 NVIDIA 都会带来一些令人惊艳的新技术。今年的 RTX 40 系列显卡首次引入了 DLSS 3 技术,利用 AI 插帧能带来至多 4 倍的帧数提升。这无疑会是 GPU 发展历史上的一场革命。‏

‏IT之家提前收到了 RTX 40 系列 GPU 中的旗舰 ——GeForce RTX 4090 Founder Edition。在本次测试中,我们将全部配置拉满,看看如今消费级 PC 的极限在哪里。具体配置如下:‏

‏外观设计‏‏:‏‏冷酷的银黑巨兽‏

‏刚拿到手中时,GeForce RTX 4090 就给人一种十足的力量感。过去高端显卡一般是三风扇三槽,而 GeForce RTX 4090 由于功耗和散热的提升,变成了一张占据 3.5 槽的巨型卡。这意味着在装机时需要准备一台大一点的机箱。同时由于重量的提升,最好搭配显卡支架使用。‏

‏GeForce RTX 4090 的 TDP 功耗提升到了 450W,为了承载更高的功耗,供电接口变成了 16 Pin,目前市面上的电源支持 16 Pin 的并不多,好在包装内附赠了 4 个 8 Pin 转 16 Pin 的转接线。因此也建议大家选择至少 850W 以上的全模组电源。‏

‏GeForce RTX 4090 整体造型继承了与 RTX 30 系列公版 GPU 几乎一致的设计,在银黑相间的装甲中,是密集的金属散热装甲与两个巨大的风扇。一前一后形成了垂直风道。‏

‏顶部的 GEFORCE RTX 标志在点亮后也会随之发光。‏

‏由于 GeForce RTX 4090 显卡尺寸比较大,所以在显卡侧面提供了显卡架螺丝孔,打开盖板即可加装显卡支架。‏

‏GeForce RTX 4090 在接口依旧是标准的 3 个 DP 1.4+1 个 HDMI 2.1,可以支持最高 8K 分辨率的显示器。‏

‏技术解析‏‏:‏‏核心规模暴涨,助力 AI 跃进‏

‏GeForce RTX 40 系列首发三款型号分别是 GeForce RTX 4090、GeForce RTX 4080 16GB、GeForce RTX 4080 12GB,我们手中的 GeForce RTX 4090 是基于目前最高端的 AD102 核心打造的,内有 16384 个 CUDA 核心、512 个 Tensor 核心、128 个光追核心、512 个纹理单元、176 个 ROP 单元,比上一代 RTX 3090 核心规模大了一半还多。后续应该还有真旗舰 RTX 4090Ti,解锁全部 GPC 单元。‏

‏GeForce RTX 4090 的核心频率是 2230-2520MHz,相比上代同样提升了一半多。显存方面依旧是 384-bit 24GB GDDR6X,但带宽提升到了 1TB / s。TDP 为 450W,达到了 RTX 3090 Ti 的档次,相比于 RTX 3090 增加了整整 100W。猜测是由于核心规模和频率双双暴涨,因此功耗也不得不提高了。‏

‏GeForce RTX 4090 的架构也发生了不小的变化,它升级到了最新的 NVIDIA Ada Lovelace 架构。它基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。‏

‏以上这些数据可能比较抽象。反映到具象的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。同时支持双 AV1 编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。总之就是游戏生产两相宜。‏

‏以上就是对 GeForce RTX 4090 的硬件规格和架构的解析了。至于大家最关心的 DLSS 3 技术,我们在稍后的游戏测试环节再给大家详解。‏

‏理论‏‏性能:跑分几乎翻倍,提升令人惊艳‏

‏这样一款旗舰,会在理论性能上有多大的进步呢?接下来我们进行理论测试,首先是单烤甜甜圈,烤机 15 分钟后,核心温度稳定在 67.6℃左右,功耗稳定在 443W 左右,符合 450W 的 TDP。风扇也远没有满载,看来这个散热还是绰绰有余,甚至还有不少超频空间的。不过这也意味着 GeForce RTX 4090 的确特别吃电源。如果配 i7 / i9 这样等级的处理器的话,还是老老实实上 1000W 以上的电源吧。‏

‏接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测 GeForce RTX 4090 的得分为 98.9%,几乎没有降频,完美通过测试。‏

‏在 3DMark TimeSpy DX12 测试中,GeForce RTX 4090 显卡分数达到了 34725 分,作为对比,GeForce RTX 3090 的分数为 18981 分,RTX 3090Ti 为 21862 分。也就是说 GeForce RTX 4090 的提升达到了 82.95%,这个提升幅度堪称恐怖。‏

‏在 3DMark Fire Strike DX11 测试中,GeForce RTX 4090 显卡分数达到了 75013 分,作为对比,GeForce RTX 3090 的分数为 46045 分,GeForce RTX 3090Ti 为 52630 分。提升幅度同样有达到了 62.91%,这个分数意味着可以 4K 分辨率流畅运行所有的游戏了,哪怕是光追游戏和 VR 游戏也能满足高刷新率的需求。‏

‏在 3DMark Portal Royal 光追测试中,GeForce RTX 4090 获得了 25080 分,提升幅度比光栅性能来得更大。比 GeForce RTX 3090 几乎提升了一倍。过去 GeForce RTX 3090 可以在 2K 分辨率下流畅体验的光追游戏,RTX 4090 已经可以再在 4K 分辨率下畅玩了。‏

RTX 4090 在理论跑分中的成绩绝对称得上是震撼,我们制作了一份 GPU 物理分数的对比表,在所有项目中 RTX 4090 相比于前代旗舰卡都有着几乎翻倍的提升。

‏DLSS 3 详解‏:AI 助力游戏,帧数 4 倍暴涨

‏虽然理论性能提升了近 80%,但 NVIDIA 并不满足于此。发布会上最重磅的一个技术升级,便是 DLSS 3 技术了。DLSS 3 是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。‏

‏基于 NVIDIA Ada Lovelace 架构的光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而无需传统游戏引擎进行建模。多帧生成模型同时获取游戏引擎中的运动矢量和光流数据,这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。‏

‏简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!‏

‏口说无凭,我们直接进入测试环节。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把 GeForce RTX 4090 的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。实测在 DLSS 2 模式下,平均帧数为 134 帧,相比于不开 DLSS 2 已经提升了两倍多。‏

‏但如果我们开启最新的 DLSS 3 技术,GeForce RTX 4090 显卡帧数直接来到了平均 165 帧,比不开 DLSS 提升了 3 倍多。这个提升相当明显。‏

‏目前,DLSS 3 已经得到了许多全球领先游戏开发者的支持,例如:

● 《超级人类》(SUPER PEOPLE):抢先体验版将于 10 月 12 日 13:00 发布,支持 DLSS 3

● 《生死轮回》(Loopmancer)将于 10 月 12 日发布更新版,支持 DLSS 3

● 《逆水寒》“拂云庭“(Justice ‘Fuyun Court’): 全新图形展示将于 10 月 13 日发布,支持 DLSS 3

● 《微软模拟飞行》(Microsoft Flight Simulator):将于 10 月 17 日为 Xbox Insider 计划成员推出测试版,支持 DLSS 3

● 《瘟疫传说:安魂曲》(A Plague Tale: Requiem):将于 10 月 18 日发布,支持 DLSS 3

此外还有超过 35 款游戏和应用宣布即将支持该技术,由于只要适配 DLSS 3 就可以向下兼容 DLSS 2,开发难度非常低,所有后续肯定会有越来越多开发商加入 DLSS 阵营。我们选取了《赛博朋克 2077》、《逆水寒》和《虚幻引擎 5:天琴座》这几款已经适配了 DLSS 3 的游戏和 Demo 来对 GeForce RTX 4090 进行测试。此外我们还会测试一款 Unity 引擎的 Demo《Enemies》。‏

‏首先是最近因为扳机社同名动画翻红的《赛博朋克 2077》,我们在 4K 最高画质超级光追 over drive 模式下运行它自带的 BenchMark,得到了以下数据。从这些数据中我们可以得到 3 条结论:‏

‏1、GeForce RTX 4090 的物理性能已经强到可以在原生 4K 分辨率下运行超级光追的《赛博朋克 2077》。‏

‏2、DLSS 3 的提升非常明显,在都开到超级性能档位的前提下,DLSS 3 比 DLSS 2 的帧数提升了 50%,比不开 DLSS 提升了 2.5 倍。‏

‏3、由于帧数提高,实际游玩中开在 DLSS 3 质量档即可体验流畅度提升并拥有更好的画质。‏

‏那么 DLSS 3 是否会对画质有严重影响呢?我们使用 NVIDIA ICAT 工具进行画面对比,可以看出左右两边的画质差距并不明显,可以说 DLSS 3 技术真的可以让我们“白捡”近一倍的帧数。‏

‏↑ 左 DLSS 关闭 ,右 DLSS 3 平衡‏

光线追踪也是 NVIDIA 带来的一大革命性功能。它能在虚拟的世界模拟出真实的全景光影和反射。比如下图中雨后湿润的地面最能表现出光追赛博朋克的魅力,仔细看水坑的差异就很明显了,未开启光追的话只有模糊的投影,而开启后便会产生栩栩如生的倒影。

‏↑ 左‏‏RT‏‏关闭 ,右‏‏RT‏‏开启‏

‏在国产武侠网游《逆水寒》‏‏“拂云庭”更新,展示了路径追踪升级带来的出色效果‏‏中,同样提供 RTX 光线追踪和 DLSS 3 的选项。我们开启 4K 最高画质来试试它的帧数表现吧。从下面的数据可以看出,DLSS 3 在《逆水寒》中的表现比《赛博朋克 2077》还要出彩。不开启 DLSS 几乎是不可玩的状态,而在开启 DLSS 3 后,帧率提高了近 5 倍。相比于同档位的 DLSS 2 也提升了近 65%。‏

‏在画质方面,我们选择了一处场景中的细节,可以看出 DLSS 关闭和 DLSS 平衡的画面差距微乎其微,甚至有些地方打开 DLSS 的画质反而更清楚了一些,这就是 AI 技术的魅力所在。‏

‏↑ 左 DLSS 关闭 ,右 DLSS 3 平衡‏

‏接下来是一款使用虚幻 5 引擎制作的游戏 Demo《‏‏天琴座‏‏》。虚幻 5 引擎提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后续会有大量基于虚幻 5 引擎打造的 3A 大作上线(比如《黑神话:悟空》)。‏

‏DLSS 3 在《天琴座》中的表现同样符合预期。在开启 DLSS 3 后,帧率提高了近 1.7 倍。相比于同档位的 DLSS 2 也提升了近 20%。‏

‏除了虚幻引擎外,Unity 引擎也提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我们测试一款画质爆炸的 Demo《Unity:Enemies》。这款 Demo 就没有那么多档位可以选了,只能调整开关。GeForce RTX 4090 在开启 DLSS 3 后,帧数暴涨了近 2.5 倍,4K 渲染丝般顺滑。‏

‏在对于 AI 来说难度颇高的衣物纹理和发丝渲染方面,打开 DLSS 和关闭 DLSS 也几乎没有画质区别,可以说在 DLSS 3 的 AI 助力下,4K 光追游戏终将普及,成为各种游戏的标配。‏

‏↑ 左 DLSS 关闭 ,右 DLSS 3 平衡‏

‏那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是 AI 生成全新帧,生成帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。‏

‏游戏实测‏‏:‏‏通吃 4K 大作,挑战 8K 畅玩‏

‏除了支持 DLSS 3 的大作外,IT之家也为大家测试了几款主流游戏。GeForce RTX 4090 本次会全程在 4K 分辨率最高画质下进行测试,在新上线的《守望先锋》“归来”中,帧数甚至可以跑到 600 帧的上限。即便是激烈战斗也能保持在 500 帧左右,电竞体验极佳。‏

‏并且这款游戏还支持 NVIDIA Reflex 低延迟,它使 CPU 能够在完成前一帧之前就开始向 GPU 提交渲染工作,从而大大减少甚至消除渲染队列,这使得响应时间更快,瞄准精度更高。‏

‏在《古墓丽影: 暗影》中,实测在 4K 分辨率最高画质下运行 BenchMark 能跑到 176 帧,已经能满足 4K144Hz 的显示器畅玩了。‏

‏这款游戏也有 DLSS 支持,但版本比较老,所以效果肯定没有 DLSS 3 那么明显了,实测 GeForce RTX 4090 下平均提升到了 185 帧。‏

‏最后我们测试一款光追 3A 大作《控制》,4K 最高画质最高光追下不开 DLSS 只能勉强流畅游玩,而 GeForce RTX 4090 开启 DLSS 后帧数直接翻倍,这个体验相当出色了。‏

‏总的来说,GeForce RTX 4090 在 4K 分辨率下已经能满足高帧数 3A 的全部要求。如此强悍的性能,再加上 DLSS 3 的加持,即便是 8K 游戏也是可以挑战的,并且 24G 的超大显存使得它自始至终都没有发生过爆显存的问题,如果你有一台 4K144Hz 显示器的话,那么 RTX 4090 的显卡会是不二之选。‏

‏创意生产‏‏:‏‏消费级生产力巅峰‏

‏到了 GeForce RTX 4090 这个级别的,肯定不仅仅是打游戏,创意生产和深度学习‏‏也‏‏是主要受。GeForce RTX 4090 也是一款通过 NVIDIA Studio 加速的 GPU。目前有超过 75 款创意应用可以调用 AI 算力,来大大提高工作效率。‏

‏在建模渲染类软件中,GeForce RTX 4090 可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。‏

‏V-Ray Benchmark 开启‏‏历史记录‏‏rce RTX 4090 GPU CUDA 加速的话,分数达到了 4221 分,创下了历史纪录。‏

‏得益于光追性能的提升,GeForce RTX 4090 在 V-Ray GPU RTX 中的分数也提高到了 5840 分,足以应对实时光追的重度渲染。‏

‏最后我们跑一下另外一款渲染软件 Octane,它可以藉由 RTX 加速的光线追踪和搭载 AI 的 OptiX 降噪可实现快速的交互式渲染。GeForce RTX 4090 最终的测试结果来看,其渲染能力已经相当于至多 26 块 GTX 980 同时工作,GPU 的提升真是日新月异啊。‏

‏在视频后期这一块,GeForce RTX 4090 配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能‏‏。‏

‏NVIDIA 与多家行业合作伙伴密切合作,当今主流多媒体应用均可以支持 AV1。目前国内的剪映专业版已经支持 NVIDIA 的 AV1 的视频编码器加速。OBS 直播软件也支持了 NVENC 的 AV1 编码的录制,希望能尽快适配 AV1 编码的直播,大大节约直播带宽。‏

‏常用的视频调色剪辑软件 DaVinci 也提供了 AV1 编码的支持,作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。‏

‏IT之家为大家测试了 PugetBench For Davinci。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。GeForce RTX 4090 最终分数可以达到 2610 分,剪辑 8K 视频也不会卡顿,实时回放也不用开代理了。‏

‏此外,NVIDIA 还为 RTX GPU 提供了 NVIDIA Broadcast 这个神器。它通过人工智能技术,实现了音频降噪、绿幕‏‏抠像‏‏、人像聚焦等实用效果。‏

‏现在笔者就在家里用一套简单的 USB 摄像头和麦克风进行直播,即便是只有这么一台电脑一个摄像头,但在 RTX GPU 的帮助下,便能在各类应用中选用 NVIDIA Broadcast 应用从而效果。‏

‏总结:AI 是我们这一代人的工业革命‏

‏虽然测试时间非常紧张,但笔者依旧被 GeForce RTX 4090 所震撼。一方面它大约 80% 的光栅性能提升属实巨大,似乎在骄傲地宣告后摩尔定律时代的 GPU 性能突破。另一方面是感慨于 NVIDIA 将 AI 技术融入了 GPU 的方方面面,甚至突破了显卡的物理法则,‏通过 DLSS 3 的 AI 技术和全景光线追踪,‏为游戏领域带来数倍的提升。‏而对于广大开发者们来说,‏怎样充分利用 RTX 40 系 GPU 的非凡 AI 算力,决定了我们如何谱写下一个世代。‏

‏价格方面,GeForce RTX 4090 Founder Edition 的建议零售价是 12999 元。和它巨大的性能提升相比,这个价格并不算昂贵。如果你是想体验 4K144Hz 的游戏发烧友,或者靠 GPU 吃饭的企业用户专业,那么 RTX 4090 绝对是目前独一无二的顶级选择。但如果你是一个‏普通玩家并不需要用到那么高端的 GPU,NVIDIA Ada Lovelace 架构的中高端型号,或考虑现在价格已趋于稳定的 RTX 30 系列型号。

‏值得一提的是,本次 NVIDIA 将限量推出 GeForce RTX 4090 FE 版,于北京时间 10 月 12 日晚 9 点在京东首发上市,旨在为钟爱 FE 版设计的发烧级玩家带来无与伦比的体验。届时玩家可以选购来自 NVIDIA FE 版和来自顶级显卡供应商的 RTX 4090 GPU 标频版和超频版。此外,非公版的 RTX 4090 显卡已由 NVIDIA 授权合作伙伴华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰推出,同样于北京时间 10 月 12 日晚 9 点在各大平台首发上市。

点此进入:RTX 4090 公版选购页面


文章标签:

本文链接:『转载请注明出处』