新一代NV卡皇RTX4090现已上市。全新Ada Lovelace架构,台积电4nm工艺制程,高达16384个CUDA核心,还有更先进的DLSS 3游戏增效技术,等等这些均是RTX4090的亮点所在。
此次RTX4090非公版评测,笔者为大家带来的是主打优质散热的映众RTX4090冰龙超级版。这款显卡采用了映众全新研发的第八代冰龙散热系统,拥有三风扇、VC均热板以及9热管的豪华堆料,散热表现值得期待。
此外,映众RTX4090冰龙超级版还是一款高频版显卡,更高的频率设置,再加上新一代冰龙散热系统的护航,可助力这款新卡皇火力全开。本篇文章,笔者就带大家瞧瞧这款非公版卡皇的非凡实力。
全新的Ada Lovelace架构与新卡皇RTX4090
RTX40系列显卡基于英伟达新一代的Ada Lovelace架构设计,为了让大家更好地了解到这一显卡的升级,笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。
(一) Ada Lovelace架构核心
(Ada Lovelace架构核心)
(完整规格的AD102显示核心,具备144组SM单元)
Ada Lovelace架构核心GPG单元
Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍,Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍,还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。
第三代RT Core结构示意图,相比前代,增加了2个功能
Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。根据英伟达官方的介绍,这一个SER功能将作为API开放给开发者使用。英伟达官方宣称,SER功能的加入最高可带来两倍RT Core性能上的改善,对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据,全新的SM(流式单元处理器)可带来最高两倍的性能以及能效升级,这一项升级不可谓不小。
Ada Lovelace架构核心SM结构图
Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外,带来了全新的第八代NVENC双硬件编码器,这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。
而除了核心上的升级以外,Ada Lovelace架构核心还大幅度提升了其L2缓存,完成版的Ada Lovelace架构核心(AD102)拥有96MB的L2缓存,大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下,通过升级更大容量的L2缓存,可以进一步提升数据命中表现,带来性能方面的升级,根据NVIDIA官方的说法,大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。
(二) DLSS 3与NVIDIA Reflex
Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新加入的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。
DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。
而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
(三) 新卡皇RTX4090
(RTX4090显示核心架构图)
RTX4090采用的是AD102-300显示核心,采用了TSMC 4N工艺进行制造,芯片面积为608平方毫米,晶体管密度达到了763亿,相比较于上一代产品提升非常明显,而这一代的核心还进一步提升了频率,因此能带来更好的性能表现。
映众RTX4090冰龙超级版的Boots默认设置为2580MHz,相比RTX4090创始人版的2520MHz高出了60MHz。
同时,根据RTX4090的频率设定来看,RTX40系列显卡的GPU频率是要大幅高于RTX30系列的。
RTX4090配备了24GB的GDDR6X显存,大显存配合性能上的提升更可以为游戏以及创作者带来更好的使用体验,RTX4090可谓是现阶段消费级显卡中顶尖存在。
而值得注意的是,现阶段发布的RTX4090采用的并非是满血版的AD102核心,而是在完整版的Ada Lovelace架构核心上屏蔽了一部分的GPG而来的产品,并且其L2缓存也从完整版的96MB降低为了72MB。因此笔者猜测,RTX 4090或有可能不是NVIDIA旗下RTX40系列最高端的型号。未来或有可能存在使用完整AD102核心的RTX 4090Ti或者TITAN RTX。
映众RTX4090冰龙超级版显卡欣赏
映众RTX4090冰龙超级版延续了冰龙系列系列的酷黑外观设计。三风扇散热设计,三插槽厚度,让这款新卡皇很有分量。
经过笔者实测,这款显卡的长度接近33.5cm。
显卡背面设计了金属背板,其上面有一些镂空设计,以便兼顾散热效果。
输出接口为三个DP 1.4a以及一个HDMI 2.1。
显卡顶部设计有加固支架,有助防止PCB弯曲变形。同时散热器顶部上面印有“GEFORCE RTX”的字样。
显卡供电接口为12VHPWR接口。玩家在装机时一定要接上这部分的供电线缆。
将散热器拆卸下来,露出显卡PCB,我们来接着瞧一瞧它的用料。
这款显卡虽然长度接近33.5cm,但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。
毕竟是旗舰显卡,映众RTX4090冰龙超级版的供电设计可谓相当强悍。GPU左右周围共设计了17相供电,搭配全封闭式电感、富士通FP固态电容等高品质元器件,用料值得信赖。
全新的AD102-300显示核心,芯片面积为608平方毫米。
上一代卡皇RTX3090Ti所采用的GA102芯片面积为628平方毫米。对比之下新一代AD102芯片面积是要小一些的。
显存是来自美光的GDDR6X,型号为2MU47 D8BZC,单颗2GB容量。这款显卡PCB正面设计有12颗显存,组建了24GB显存容量。
再来瞧瞧它的冰龙散热器。第八代冰龙散热系统采用三枚10cm直径的大尺寸散热风扇。同时,这款散热器支持智能风扇停转功能,在待机状态下或者轻负载状态下,它的这3枚风扇会全部停转,以便实现安静的运行效果。
这款散热器的金属主体也是相当的庞大,不仅能够为GPU进行散热,而还能够为显存、电感以及MOS管进行散热。
拥有9热管的豪华散热堆料,散热鳍片厚度更是达到了3SLOT级别。
散热器底座为VC均热板,具备优秀的导热性能。
这款显卡的散热器上面还采用大面积IML模内印刷RGB灯箱设计,让这款新卡皇炫酷有型。
RGB灯效可以利用映众研发的INNO3D TuneIT软件进行调节。
测试平台介绍
笔者组建了一套性能出色的12代酷睿i9测试平台,用来测试显卡的性能。为了对比映众RTX4090冰龙超级版显卡的性能,笔者此次测试还加入了上代卡皇RTX3090Ti的成绩。
此次测试所选用的这款RTX3090Ti是一款非公版显卡,其GPU频率为1560MHz,Boost频率为1890MHz,显存频率为1313MHz(等效21008MHz)。
英特尔12代酷睿处理器搭配RTX40系列独立显卡是支持Resizable BAR技术的。为了充分发挥映众RTX4090冰龙超级版显卡的性能表现,以下测试环节均是在Resizable BAR开启状态下进行的。
DLSS 3是RTX40系列显卡带来的全新技术,在维持高画质的情况下也可以实现更为流畅的游戏表现,这也让玩家可以更好的享受4K光追游戏带来的极致画质体验。为了更好的感受RTX4090显卡在游戏方面的升级,我们在测试RTX4090显卡时特意选择了爱攻&保时捷(Porsche Design)联合设计的PD32M显示器。
这款显示器为31.5英寸,采用MIni LED背光技术,拥有1152个独立分区,拥有1600尼特峰值亮度,8000万:1动态对比度,并通过HDR1400认证,在画质上有着更为出色的表现。此外,PD32M拥有4K分辨率以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆盖,并且拥有HDMI 2.1接口,是一款旗舰级电竞显示器。
游戏性能测试
(一)3DMark基准测试
让我们先来瞧瞧这款RTX4090显卡在3DMark基准测试当中的表现。到底比上一代卡皇RTX3090Ti强多少,大家一看便知。
在3DMark Time Spy测试项目中,这款RTX4090的显卡成绩约为RTX3090Ti的1.67倍。
在3DMark Port Royal光线追踪测试项目中,这款RTX4090的显卡成绩约为RTX3090Ti的1.74倍。
显而易见,单从跑分成绩来看,RTX4090显卡的性能提升堪称是非常大的。
(二) DLSS 3基准测试
3DMark基准测试新增加了DLSS功能测试(DLSS 3)。该测试项目现在还处在测试阶段,需要下载NVIDIA提供的测试版程序。
根据实测来看,在开启DLSS 3之后,RTX4090显卡在2K、4K分辨率下均实现了巨大的FPS提升。
在更高的8K分辨率下,开启DLSS 3之后RTX4090显卡的FPS依然能跑到60帧以上。可以说在DLSS 3技术的助力之下,RTX4090显卡能够畅玩的8K游戏会更多。
(三)DLSS 3游戏实测
根据NV官方的介绍,目前已有超过35款游戏和应用宣布即将支持DLSS 3技术,其中包括《赛博朋克2077》、《逆水寒》等热门游戏大作。此次DLSS 3游戏实测,笔者将利用《赛博朋克2077》、《逆水寒》、《瘟疫传说:安魂曲》这3款游戏进行测试。注意,这三款游戏DLSS 3版本目前均处于测试阶段,进行测试的话同样需要下载NVIDIA提供的测试版游戏。
DLSS 3游戏测试版——《赛博朋克2077》
DLSS 3游戏测试版——《逆水寒》
DLSS 3游戏测试版——《瘟疫传说:安魂曲》
通过上述三款DLSS 3游戏来看,DLSS 3技术为RTX40系列显卡带来的游戏帧数提升是巨大的。
NVIDIA的DLSS 3技术除了能够助力游戏帧数的大幅提升之外,还有一大优势,那就是助力游戏画质的提升。
上图这个《赛博朋克2077》游戏场景,开启DLSS质量模式之后,篮球架上面的针叶树的树叶模型要更加精细。
上图这个《逆水寒》游戏场景,开启DLSS质量模式之后,屋檐下灯笼的模型要更加精细。
上图这个《瘟疫传说:安魂曲》游戏场景,开启DLSS画质模式之后,树叶的模型要更加精细。
(四) 其它游戏实测
接下来,笔者再测试一些非DLSS 3游戏。
游戏实测——《地铁:离去》
游戏实测——《刺客信条:奥德赛》
游戏实测——《战争机器5》
游戏实测——《幽灵行动:荒野》
游戏实测——《光明记忆:无限》
游戏实测——《古墓丽影:暗影》
游戏实测——《无主之地3》
对比上一代卡皇RTX3090Ti,新一代卡皇RTX4090的游戏性能提升是非常显著的。
生产力性能测试
(一) AV1硬件加速编解码测试
为什么AV1编解码技术越来越受欢迎?理由很简单,采用AV1编解码的视频能够以更低的码率,实现其它主流编解码视频相同的画质。说白了,在视频画质相同的情况下,采用AV1编解码的视频文件体积会更小,以至于能够为视频创作者们节省大量的硬盘空间。
目前万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。以万兴喵影为例,分别利用AV1编解码和H.264编解码导出一部码率基本相同的MP4视频。
最终,AV1编解码的视频体积仅为853MB,而H.264编解码的视频体积则达到了1.22GB。怎么样,AV1编解码技术可以高效地帮助你节省硬盘空间。
目前达芬奇这款软件已推出了支持N卡AV1硬件加速编解码的测试版。
将一部12GB容量的4K视频,利用N卡AV1硬件加速编解码导出一部MP4视频。最终,利用RTX4090的加速效果,视频导出时间仅为48秒,速度相当快。
(二) H.265硬件加速编解码测试
利用达芬奇这款软件将一部12GB容量的4K视频,利用H.265编解码导出一部MP4视频。此项测试对比了RTX3090Ti的成绩。
最终,RTX4090的成绩为43秒,而RTX3090Ti的成绩为85秒。新卡皇的H.265加速能力也要比老卡皇好上很多。
(三) 工业设计领域测试
利用SPECviewperf 13这款基准测试软件,笔者再来实测下RTX4090显卡在工业设计领域的表现。
显而易见,RTX4090在工业设计领域的性能提升也是相当大的。
散热器测试
(注:笔者所处的室温维持在26℃)
利用FurMark,笔者将对这款显卡进行压力测试。
默认频率下,烤机十分钟之后GPU温度稳定在了约68℃,GPU频率温度在了约2805MHz,显卡功耗约450W左右。散热器风扇转速约1490 RPM,静音效果不错。
上一代卡皇RTX3090Ti满载状态下GPU频率也就2000MHz出头,而现在,RTX4090满载状态下GPU频率已能突破2800MHz了,不得不说新一代RTX40系列显卡的GPU频率确实高了很多。
产品总结:冰龙护航,造就给力新卡皇!
无论游戏性能还是生产力性能,映众RTX4090冰龙超级版显卡均要大幅超越前代。对于追求极致性能的用户们来说,新一代RTX4090无疑是非常值得拥有的。
同时,作为主打优质散热的RTX4090显卡,映众RTX4090冰龙超级版的散热表现也很给力,静音效果也很不错。性能强大又安静,这也是映众冰龙系列显卡一贯所追求的产品体验。对于这款新卡皇,笔者力推!
好了,此次评测就写到这里了,希望大家喜欢。根据映众官方的消息,映众RTX4090冰龙超级版显卡将于北京时间10月12号晚上正式开售,心仪的朋友们可以前往天猫商城映众旗舰店购买。