每次 NVIDIA 发布新一代的显卡,总会在玩家群体中引起轰动。一方面是核心性能的提升往往突飞猛进,更重要的是每次 NVIDIA 都会带来一些令人惊艳的新技术。今年的 RTX 40 系列显卡首次引入了 DLSS 3 技术,利用 AI 插帧能带来至多 4 倍的帧数提升。这无疑会是 GPU 发展历史上的一场革命。
IT之家提前收到了 RTX 40 系列 GPU 中的旗舰 ——GeForce RTX 4090 Founder Edition。在本次测试中,我们将全部配置拉满,看看如今消费级 PC 的极限在哪里。具体配置如下:
外观设计:冷酷的银黑巨兽
刚拿到手中时,GeForce RTX 4090 就给人一种十足的力量感。过去高端显卡一般是三风扇三槽,而 GeForce RTX 4090 由于功耗和散热的提升,变成了一张占据 3.5 槽的巨型卡。这意味着在装机时需要准备一台大一点的机箱。同时由于重量的提升,最好搭配显卡支架使用。
GeForce RTX 4090 的 TDP 功耗提升到了 450W,为了承载更高的功耗,供电接口变成了 16 Pin,目前市面上的电源支持 16 Pin 的并不多,好在包装内附赠了 4 个 8 Pin 转 16 Pin 的转接线。因此也建议大家选择至少 850W 以上的全模组电源。
GeForce RTX 4090 整体造型继承了与 RTX 30 系列公版 GPU 几乎一致的设计,在银黑相间的装甲中,是密集的金属散热装甲与两个巨大的风扇。一前一后形成了垂直风道。
顶部的 GEFORCE RTX 标志在点亮后也会随之发光。
由于 GeForce RTX 4090 显卡尺寸比较大,所以在显卡侧面提供了显卡架螺丝孔,打开盖板即可加装显卡支架。
GeForce RTX 4090 在接口依旧是标准的 3 个 DP 1.4+1 个 HDMI 2.1,可以支持最高 8K 分辨率的显示器。
技术解析:核心规模暴涨,助力 AI 跃进
GeForce RTX 40 系列首发三款型号分别是 GeForce RTX 4090、GeForce RTX 4080 16GB、GeForce RTX 4080 12GB,我们手中的 GeForce RTX 4090 是基于目前最高端的 AD102 核心打造的,内有 16384 个 CUDA 核心、512 个 Tensor 核心、128 个光追核心、512 个纹理单元、176 个 ROP 单元,比上一代 RTX 3090 核心规模大了一半还多。后续应该还有真旗舰 RTX 4090Ti,解锁全部 GPC 单元。
GeForce RTX 4090 的核心频率是 2230-2520MHz,相比上代同样提升了一半多。显存方面依旧是 384-bit 24GB GDDR6X,但带宽提升到了 1TB / s。TDP 为 450W,达到了 RTX 3090 Ti 的档次,相比于 RTX 3090 增加了整整 100W。猜测是由于核心规模和频率双双暴涨,因此功耗也不得不提高了。
GeForce RTX 4090 的架构也发生了不小的变化,它升级到了最新的 NVIDIA Ada Lovelace 架构。它基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
以上这些数据可能比较抽象。反映到具象的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。同时支持双 AV1 编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。总之就是游戏生产两相宜。
以上就是对 GeForce RTX 4090 的硬件规格和架构的解析了。至于大家最关心的 DLSS 3 技术,我们在稍后的游戏测试环节再给大家详解。
理论性能:跑分几乎翻倍,提升令人惊艳
这样一款旗舰,会在理论性能上有多大的进步呢?接下来我们进行理论测试,首先是单烤甜甜圈,烤机 15 分钟后,核心温度稳定在 67.6℃左右,功耗稳定在 443W 左右,符合 450W 的 TDP。风扇也远没有满载,看来这个散热还是绰绰有余,甚至还有不少超频空间的。不过这也意味着 GeForce RTX 4090 的确特别吃电源。如果配 i7 / i9 这样等级的处理器的话,还是老老实实上 1000W 以上的电源吧。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测 GeForce RTX 4090 的得分为 98.9%,几乎没有降频,完美通过测试。
在 3DMark TimeSpy DX12 测试中,GeForce RTX 4090 显卡分数达到了 34725 分,作为对比,GeForce RTX 3090 的分数为 18981 分,RTX 3090Ti 为 21862 分。也就是说 GeForce RTX 4090 的提升达到了 82.95%,这个提升幅度堪称恐怖。
在 3DMark Fire Strike DX11 测试中,GeForce RTX 4090 显卡分数达到了 75013 分,作为对比,GeForce RTX 3090 的分数为 46045 分,GeForce RTX 3090Ti 为 52630 分。提升幅度同样有达到了 62.91%,这个分数意味着可以 4K 分辨率流畅运行所有的游戏了,哪怕是光追游戏和 VR 游戏也能满足高刷新率的需求。
在 3DMark Portal Royal 光追测试中,GeForce RTX 4090 获得了 25080 分,提升幅度比光栅性能来得更大。比 GeForce RTX 3090 几乎提升了一倍。过去 GeForce RTX 3090 可以在 2K 分辨率下流畅体验的光追游戏,RTX 4090 已经可以再在 4K 分辨率下畅玩了。
RTX 4090 在理论跑分中的成绩绝对称得上是震撼,我们制作了一份 GPU 物理分数的对比表,在所有项目中 RTX 4090 相比于前代旗舰卡都有着几乎翻倍的提升。
DLSS 3 详解:AI 助力游戏,帧数 4 倍暴涨
虽然理论性能提升了近 80%,但 NVIDIA 并不满足于此。发布会上最重磅的一个技术升级,便是 DLSS 3 技术了。DLSS 3 是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
基于 NVIDIA Ada Lovelace 架构的光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而无需传统游戏引擎进行建模。多帧生成模型同时获取游戏引擎中的运动矢量和光流数据,这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!
口说无凭,我们直接进入测试环节。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把 GeForce RTX 4090 的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。实测在 DLSS 2 模式下,平均帧数为 134 帧,相比于不开 DLSS 2 已经提升了两倍多。
但如果我们开启最新的 DLSS 3 技术,GeForce RTX 4090 显卡帧数直接来到了平均 165 帧,比不开 DLSS 提升了 3 倍多。这个提升相当明显。
目前,DLSS 3 已经得到了许多全球领先游戏开发者的支持,例如:
● 《超级人类》(SUPER PEOPLE):抢先体验版将于 10 月 12 日 13:00 发布,支持 DLSS 3
● 《生死轮回》(Loopmancer)将于 10 月 12 日发布更新版,支持 DLSS 3
● 《逆水寒》“拂云庭“(Justice ‘Fuyun Court’): 全新图形展示将于 10 月 13 日发布,支持 DLSS 3
● 《微软模拟飞行》(Microsoft Flight Simulator):将于 10 月 17 日为 Xbox Insider 计划成员推出测试版,支持 DLSS 3
● 《瘟疫传说:安魂曲》(A Plague Tale: Requiem):将于 10 月 18 日发布,支持 DLSS 3
此外还有超过 35 款游戏和应用宣布即将支持该技术,由于只要适配 DLSS 3 就可以向下兼容 DLSS 2,开发难度非常低,所有后续肯定会有越来越多开发商加入 DLSS 阵营。我们选取了《赛博朋克 2077》、《逆水寒》和《虚幻引擎 5:天琴座》这几款已经适配了 DLSS 3 的游戏和 Demo 来对 GeForce RTX 4090 进行测试。此外我们还会测试一款 Unity 引擎的 Demo《Enemies》。
首先是最近因为扳机社同名动画翻红的《赛博朋克 2077》,我们在 4K 最高画质超级光追 over drive 模式下运行它自带的 BenchMark,得到了以下数据。从这些数据中我们可以得到 3 条结论:
1、GeForce RTX 4090 的物理性能已经强到可以在原生 4K 分辨率下运行超级光追的《赛博朋克 2077》。
2、DLSS 3 的提升非常明显,在都开到超级性能档位的前提下,DLSS 3 比 DLSS 2 的帧数提升了 50%,比不开 DLSS 提升了 2.5 倍。
3、由于帧数提高,实际游玩中开在 DLSS 3 质量档即可体验流畅度提升并拥有更好的画质。
那么 DLSS 3 是否会对画质有严重影响呢?我们使用 NVIDIA ICAT 工具进行画面对比,可以看出左右两边的画质差距并不明显,可以说 DLSS 3 技术真的可以让我们“白捡”近一倍的帧数。
↑ 左 DLSS 关闭 ,右 DLSS 3 平衡
光线追踪也是 NVIDIA 带来的一大革命性功能。它能在虚拟的世界模拟出真实的全景光影和反射。比如下图中雨后湿润的地面最能表现出光追赛博朋克的魅力,仔细看水坑的差异就很明显了,未开启光追的话只有模糊的投影,而开启后便会产生栩栩如生的倒影。
↑ 左RT关闭 ,右RT开启
在国产武侠网游《逆水寒》“拂云庭”更新,展示了路径追踪升级带来的出色效果中,同样提供 RTX 光线追踪和 DLSS 3 的选项。我们开启 4K 最高画质来试试它的帧数表现吧。从下面的数据可以看出,DLSS 3 在《逆水寒》中的表现比《赛博朋克 2077》还要出彩。不开启 DLSS 几乎是不可玩的状态,而在开启 DLSS 3 后,帧率提高了近 5 倍。相比于同档位的 DLSS 2 也提升了近 65%。
在画质方面,我们选择了一处场景中的细节,可以看出 DLSS 关闭和 DLSS 平衡的画面差距微乎其微,甚至有些地方打开 DLSS 的画质反而更清楚了一些,这就是 AI 技术的魅力所在。
↑ 左 DLSS 关闭 ,右 DLSS 3 平衡
接下来是一款使用虚幻 5 引擎制作的游戏 Demo《天琴座》。虚幻 5 引擎提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后续会有大量基于虚幻 5 引擎打造的 3A 大作上线(比如《黑神话:悟空》)。
DLSS 3 在《天琴座》中的表现同样符合预期。在开启 DLSS 3 后,帧率提高了近 1.7 倍。相比于同档位的 DLSS 2 也提升了近 20%。
除了虚幻引擎外,Unity 引擎也提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我们测试一款画质爆炸的 Demo《Unity:Enemies》。这款 Demo 就没有那么多档位可以选了,只能调整开关。GeForce RTX 4090 在开启 DLSS 3 后,帧数暴涨了近 2.5 倍,4K 渲染丝般顺滑。
在对于 AI 来说难度颇高的衣物纹理和发丝渲染方面,打开 DLSS 和关闭 DLSS 也几乎没有画质区别,可以说在 DLSS 3 的 AI 助力下,4K 光追游戏终将普及,成为各种游戏的标配。
↑ 左 DLSS 关闭 ,右 DLSS 3 平衡
那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是 AI 生成全新帧,生成帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。
游戏实测:通吃 4K 大作,挑战 8K 畅玩
除了支持 DLSS 3 的大作外,IT之家也为大家测试了几款主流游戏。GeForce RTX 4090 本次会全程在 4K 分辨率最高画质下进行测试,在新上线的《守望先锋》“归来”中,帧数甚至可以跑到 600 帧的上限。即便是激烈战斗也能保持在 500 帧左右,电竞体验极佳。
并且这款游戏还支持 NVIDIA Reflex 低延迟,它使 CPU 能够在完成前一帧之前就开始向 GPU 提交渲染工作,从而大大减少甚至消除渲染队列,这使得响应时间更快,瞄准精度更高。
在《古墓丽影: 暗影》中,实测在 4K 分辨率最高画质下运行 BenchMark 能跑到 176 帧,已经能满足 4K144Hz 的显示器畅玩了。
这款游戏也有 DLSS 支持,但版本比较老,所以效果肯定没有 DLSS 3 那么明显了,实测 GeForce RTX 4090 下平均提升到了 185 帧。
最后我们测试一款光追 3A 大作《控制》,4K 最高画质最高光追下不开 DLSS 只能勉强流畅游玩,而 GeForce RTX 4090 开启 DLSS 后帧数直接翻倍,这个体验相当出色了。
总的来说,GeForce RTX 4090 在 4K 分辨率下已经能满足高帧数 3A 的全部要求。如此强悍的性能,再加上 DLSS 3 的加持,即便是 8K 游戏也是可以挑战的,并且 24G 的超大显存使得它自始至终都没有发生过爆显存的问题,如果你有一台 4K144Hz 显示器的话,那么 RTX 4090 的显卡会是不二之选。
创意生产:消费级生产力巅峰
到了 GeForce RTX 4090 这个级别的,肯定不仅仅是打游戏,创意生产和深度学习也是主要受。GeForce RTX 4090 也是一款通过 NVIDIA Studio 加速的 GPU。目前有超过 75 款创意应用可以调用 AI 算力,来大大提高工作效率。
在建模渲染类软件中,GeForce RTX 4090 可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
V-Ray Benchmark 开启历史记录rce RTX 4090 GPU CUDA 加速的话,分数达到了 4221 分,创下了历史纪录。
得益于光追性能的提升,GeForce RTX 4090 在 V-Ray GPU RTX 中的分数也提高到了 5840 分,足以应对实时光追的重度渲染。
最后我们跑一下另外一款渲染软件 Octane,它可以藉由 RTX 加速的光线追踪和搭载 AI 的 OptiX 降噪可实现快速的交互式渲染。GeForce RTX 4090 最终的测试结果来看,其渲染能力已经相当于至多 26 块 GTX 980 同时工作,GPU 的提升真是日新月异啊。
在视频后期这一块,GeForce RTX 4090 配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。
NVIDIA 与多家行业合作伙伴密切合作,当今主流多媒体应用均可以支持 AV1。目前国内的剪映专业版已经支持 NVIDIA 的 AV1 的视频编码器加速。OBS 直播软件也支持了 NVENC 的 AV1 编码的录制,希望能尽快适配 AV1 编码的直播,大大节约直播带宽。
常用的视频调色剪辑软件 DaVinci 也提供了 AV1 编码的支持,作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。
IT之家为大家测试了 PugetBench For Davinci。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。GeForce RTX 4090 最终分数可以达到 2610 分,剪辑 8K 视频也不会卡顿,实时回放也不用开代理了。
此外,NVIDIA 还为 RTX GPU 提供了 NVIDIA Broadcast 这个神器。它通过人工智能技术,实现了音频降噪、绿幕抠像、人像聚焦等实用效果。
现在笔者就在家里用一套简单的 USB 摄像头和麦克风进行直播,即便是只有这么一台电脑一个摄像头,但在 RTX GPU 的帮助下,便能在各类应用中选用 NVIDIA Broadcast 应用从而效果。
总结:AI 是我们这一代人的工业革命
虽然测试时间非常紧张,但笔者依旧被 GeForce RTX 4090 所震撼。一方面它大约 80% 的光栅性能提升属实巨大,似乎在骄傲地宣告后摩尔定律时代的 GPU 性能突破。另一方面是感慨于 NVIDIA 将 AI 技术融入了 GPU 的方方面面,甚至突破了显卡的物理法则,通过 DLSS 3 的 AI 技术和全景光线追踪,为游戏领域带来数倍的提升。而对于广大开发者们来说,怎样充分利用 RTX 40 系 GPU 的非凡 AI 算力,决定了我们如何谱写下一个世代。
价格方面,GeForce RTX 4090 Founder Edition 的建议零售价是 12999 元。和它巨大的性能提升相比,这个价格并不算昂贵。如果你是想体验 4K144Hz 的游戏发烧友,或者靠 GPU 吃饭的企业用户专业,那么 RTX 4090 绝对是目前独一无二的顶级选择。但如果你是一个普通玩家并不需要用到那么高端的 GPU,NVIDIA Ada Lovelace 架构的中高端型号,或考虑现在价格已趋于稳定的 RTX 30 系列型号。
值得一提的是,本次 NVIDIA 将限量推出 GeForce RTX 4090 FE 版,于北京时间 10 月 12 日晚 9 点在京东首发上市,旨在为钟爱 FE 版设计的发烧级玩家带来无与伦比的体验。届时玩家可以选购来自 NVIDIA FE 版和来自顶级显卡供应商的 RTX 4090 GPU 标频版和超频版。此外,非公版的 RTX 4090 显卡已由 NVIDIA 授权合作伙伴华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰推出,同样于北京时间 10 月 12 日晚 9 点在各大平台首发上市。
点此进入:RTX 4090 公版选购页面