RTX 4090 已经上市有一阵子了,也已经有不少土豪们已经到手装机了。在已经有的消费者评论中,笔者注意到有一款非公版显卡受到了特别多的好评,它就是索泰 RTX4090 AMP EXTREME AIRO。之所以好评,是因为它的灯光设计非常出彩,圆润如水的灯带也能很好地融入侧透机箱中,因此成为了 DIYer 们的心头好。
IT之家也收到了索泰 RTX4090 AMP EXTREME AIRO,在本次测试中,与之前的测试不同,我们将 CPU 配置升级到了 i9-13900K,真正做到了无瓶颈的性能测试。具体配置如下:
外观设计
索泰 GeForce RTX 4090 AMP EXTREME AIRO 显卡同样是一张 3.5 槽的巨型显卡,三维为 35.5*16.6*7.2cm。整体采用了银灰色的涂装,而且风扇面外框的造型独特,四周圆润且没有完整覆盖下方的散热模组,边缘做了大面积的高光倒角和斜切处理。官方表示,其设计创意灵感来自空气动力学。
索泰 GeForce RTX 4090 AMP EXTREME AIRO 显卡采用三风扇设计,风扇直径 11cm,每个风扇有 9 片黑色扇叶组成,扇叶表面的鳞状仿生条纹可提升风扇运行效率。中间用金色拉丝纹理点缀,并印有索泰的图形和英文 Logo。仔细看,风扇间隔部分的外框上还有横向条形纹理装饰。
索泰 GeForce RTX 4090 AMP EXTREME AIRO 显卡的背板部分同样为圆润设计,并增加了合金加固骨骼结构,确保 PCB 均匀受力。背板左侧印有一个很大的图形 Logo,该 Logo 支持 RGB 灯效。背板中间区域加入了拟物风的空气动力学凹陷纹理,右侧是 3 个 1 组的镂空开孔。
显卡背板最外圈是一层白色包边,上方印有 Geforce RTX 的标识。
从侧面看过去,索泰 GeForce RTX 4090 AMP EXTREME AIRO 显卡的外框整体像是从右侧嵌入的感觉,流线型设计感很强。外框下面是密集的散热格栅,内含 9 热管 + 超大 VC 均热板的散热模组。
索泰 GeForce RTX 4090 AMP EXTREME AIRO 显卡在外框另一侧加入了一条流线型的侧边灯带,当灯光亮起时会显示出隐藏其中的索泰英文 Logo 和图形 Logo,官方称其为虹桥幻影设计,灵感来源于北欧神话中的彩虹桥。
右侧边这里的圆弧外框架上分布着一条条的小 RGB 灯,点亮后显卡将更具立体层次感。不难看出这张显卡整体的 RGB 元素是非常多的。
I / O 接口挡板采用深灰配色,整体面积较大。接口方面配备了 3*DP1.4 接口和 1*HDMI2.1 接口,最高支持 8K60 帧输出。
索泰 GeForce RTX 4090 AMP EXTREME AIRO 显卡的一侧中间区域上方,有一个双 BIOS 切换开关,玩家可从加速模式和寂静模式中选择一个,调节风扇的散热策略。下文测试我们均会在加速模式下进行。
理论性能
索泰 RTX4090 AMP EXTREME AIRO 同样是基于目前 NVIDIA 最高端的 AD102 核心打造的,内有 16384 个 CUDA 核心、512 个 Tensor 核心、128 个光追核心、512 个纹理单元、176 个 ROP 单元,比上一代 RTX 3090 核心规模大了一半还多。索泰 RTX4090 AMP EXTREME AIRO 的核心频率是 2235-2580MHz,比公版要略微高一点点。显存方面是 384-bit 的 24GB GDDR6X,但频率达到了等效 21Gbps。
RTX 4090 的架构也发生了不小的变化,它升级到了最新的 NVIDIA Ada Lovelace 架构。它基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。特别是在 AI 能力和光线追踪能力上有了巨大的突破。反映到具体的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。同时支持双 AV1 编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。
接下来我们进行理论测试,首先是单烤甜甜圈,烤机 15 分钟后,核心温度稳定在 68.2℃左右,功耗稳定在 450W 左右,这个功耗和散热表现与公版 RTX 4090 是基本一致的。但风扇转速更低,使用起来比公版的双风扇更加安静,所以说 RTX 4090 系列非公的散热系统是明显过剩的。在烤机中,笔者还顺便进行了 CPU 的双烤,最终整机功耗约 750W 左右。可以说 850W 不虚标的电源是勉强够 i9+RTX 4090 的,但还是建议上至少 1000W 的电源。
接下来进行 3DMark FireStrike 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测索泰 RTX4090 AMP EXTREME AIRO的得分为 99.2%,完美通过测试。
在 3DMark TimeSpy DX12 测试中索泰 RTX4090 AMP EXTREME AIRO显卡分数达到了 35635 分,比公版的 34720 分高了不少,看来索泰在出厂时做了一些预超频。
在 3DMark Fire Strike Extreme DX11 测试中,索泰 RTX4090 AMP EXTREME AIRO显卡分数达到了 44428 分,同样比公版的略高,这个分数意味着几乎可以 8K 分辨率流畅运行所有的游戏了,哪怕是 4K 光追游戏和 VR 游戏也能满足高刷新率的需求。
在 3DMark Portal Royal 光追测试中,索泰 RTX4090 AMP EXTREME AIRO获得了 25465 分,比 GeForce RTX 3090 几乎提升了一倍,与老黄在发布会上的展示基本一致。过去 RTX 3090 可以在 2K 分辨率下流畅体验的光追游戏,RTX 4090 已经可以在 4K 分辨率下畅玩了。
DLSS 3 详解
发布会上最重磅的一个技术升级,便是 DLSS 3 技术了。DLSS 3 是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
基于 NVIDIA Ada Lovelace 架构的光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而无需传统游戏引擎进行建模。多帧生成模型同时获取游戏引擎中的运动矢量和光流数据,这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。在实际使用中,DLSS 3 更适合把一个比较高的帧数补到更高的帧数。因此需要结合 DLSS 2 的超分辨率功能,把原来很低的帧数先变高,然后再用 DLSS 3 变得更高。一套操作下来 AI 能重建至多八分之七的像素。
口说无凭,我们直接进入测试环节。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把索泰 RTX4090 AMP EXTREME AIRO的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。实测在 DLSS 2 模式下,平均帧数为 136 帧,相比于不开 DLSS 2 已经提升了 2.5 倍左右。
但如果我们开启最新的 DLSS 3 技术,帧数直接来到了平均 169 帧,比不开 DLSS 提升了 3 倍多,这多出来的这 30 几帧就是 DLSS 3 插入的帧数。
目前 DLSS 3 已经适配了不少新游戏,由于只要适配 DLSS 3 就可以向下兼容 DLSS 2,开发难度非常低,所有后续肯定会有越来越多开发商加入 DLSS 阵营。我们选取了《赛博朋克 2077》、《逆水寒》和《虚幻引擎 5:天琴座》这几款已经适配了 DLSS 3 的游戏和 Demo 来对索泰 RTX4090 AMP EXTREME AIRO进行测试。此外我们还会测试一款 Unity 引擎的 Demo《Enemies》。
首先是显卡杀手《赛博朋克 2077》,我们在 4K 最高画质超级光追档位下运行它自带的 BenchMark,得到了以下数据。在索泰 RTX 4090 上,DLSS 3 的提升同样非常明显,在都开到超级性能档位的前提下,DLSS 3 比 DLSS 2 的帧数提升了近 50%,比不开 DLSS 提升了 2.5 倍。
在国产武侠网游《逆水寒》中,同样提供 RTX 光线追踪和 DLSS 3 的选项。从下面的数据可以看出,DLSS 3 在《逆水寒》中的表现比《赛博朋克 2077》还要出彩。不开启 DLSS 几乎是不可玩的状态,而在开启 DLSS 3 后,帧率提高了近 5 倍。相比于同档位的 DLSS 2 也提升了近 65%。
在画质方面,我们选择了一处场景中的细节,可以看出 DLSS 确实会降低渲染分辨率,但在 4K 显示器这样的尺度来看,差别并不大。
↑ 左 DLSS 关闭 ,右 DLSS 3 平衡
接下来是一款使用虚幻 5 引擎制作的游戏 Demo《天琴座》。虚幻 5 引擎提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后续会有大量基于虚幻 5 引擎打造的 3A 大作上线(比如《黑神话:悟空》)。
DLSS 3 在《天琴座》中的表现同样符合预期。在开启 DLSS 3 后,帧率提高了近 2.5 倍。相比于同档位的 DLSS 2 也提升了近 10%。和我们之前测试的 i9-12900K 相比,由于 CPU 瓶颈的移除,RTX 4090 的性能被进一步释放了。
除了虚幻引擎外,Unity 引擎也提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我们测试一款画质爆炸的 Demo《Unity:Enemies》。这款 Demo 就没有那么多档位可以选了,只能调整开关。索泰 RTX4090 AMP EXTREME AIRO在开启 DLSS 3 后,帧数暴涨了近 3 倍,4K 渲染丝般顺滑。
那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是 AI 生成全新帧,生成帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。实际测试下来,开启 DLSS 3+NVIDIA Reflex 后的平均延迟比啥也不开反而还要更低了。
在新上线的《守望先锋》“归来”中,这个电竞延迟就显得格外重要了。高帧数就意味着延迟的降低,对于分秒必争的射击游戏来说更是如此。除了提高帧数外,优化渲染管线也能降低平均延迟,这正是 NVIDIA Reflex 的原理。
同时《守望先锋》“归来”也支持 NVIDIA Reflex 低延迟,它使 CPU 能够在完成前一帧之前就开始向 GPU 提交渲染工作,从而大大减少甚至消除渲染队列,这使得响应时间更快,瞄准精度更高。
除了上述使用新技术的游戏外,我们也测试了两款传统的 3A 大作。在《古墓丽影:暗影》中,4K 分辨率最高画质下即便不开 DLSS 也能达到 192 帧,流畅游玩已不在话下。
在开启 DLSS 后,帧数更是暴涨到 268 帧。别说是 4K 了,8K 流畅游玩都已经不在话下了。
最后我们测试一款光追 3A 大作《控制》,4K 最高画质最高光追下不开 DLSS 只能勉强流畅游玩,而索泰 RTX4090 AMP EXTREME AIRO开启 DLSS 后帧数直接翻倍,这个体验相当出色了。
创意生产
作为 RTX 4090 这个档位的顶级显卡,索泰 RTX4090 AMP EXTREME AIRO 的作用并不局限于打游戏,创意生产和深度学习也是主要受众。RTX 4090 也可以通过 NVIDIA Studio 对超过 75 款创意应用进行加速,来大大提高工作效率。
在建模渲染类软件中,RTX 4090 可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
V-Ray CUDA Benchmark 的分数达到了 4387 分,比公版卡高了大约 200 分,看来提升频率在建模软件中很有用。
得益于光追性能的提升,索泰 RTX4090 AMP EXTREME AIRO在 V-Ray GPU RTX 中的分数也提高到了 6048 分,比公版 RTX 4090 高了近 200 分,足以应对实时光追的重度渲染。
在视频后期这一块,GeForce RTX 40 系列均配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。
NVIDIA 与多家行业合作伙伴密切合作,当今主流多媒体应用均可以支持 AV1。目前国内的剪映专业版已经支持 NVIDIA 的 AV1 的视频编码器加速。OBS 直播软件也支持了 NVENC 的 AV1 编码的录制,希望能尽快适配 AV1 编码的直播,大大节约直播带宽。
常用的视频调色剪辑软件 DaVinci 也提供了 AV1 编码的支持,作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。
IT之家为大家测试了 PugetBench For Davinci。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。索泰 RTX4090 AMP EXTREME AIRO最终分数可以达到 2947 分,与 i9-13900K 的配合无间。
在 PugetBench For Pr 和 Ae 这样的视频后期软件中,RTX 4090 也能利用招牌的 Cuda 加速,大大加快视频的预览和导出进程。实测 PugetBench For Pr 的分数达到了 1646 分,是我们测过的最高分数。
而 PugetBench For Ae 的分数则达到了 1674 分,流畅做重度特效不在话下。
总结
与大部分 RTX 4090 非公显卡一样,索泰 RTX4090 AMP EXTREME AIRO 也展现出了极其强大的散热能力,以及超出公版卡的性能。但和其它非公显卡不一样的地方在于,索泰 RTX4090 AMP EXTREME AIRO 整体的圆润设计与今年普遍追求硬朗直角的风潮截然不同。对于喜欢这种设计风格的 DIYer 们来说,它确实是当下难得的选择。
目前索泰 RTX4090 AMP EXTREME AIRO 已经开售,感兴趣的话不妨关注一下。