不惜堆料的旗舰“芯”王，索泰 GeForce RTX 4090 PGF OC显卡评测

前言

试问大家，RTX40系显卡中，谁的性能给你震撼一击？想必不少玩家都会选择大名鼎鼎的GeForceRTX4090显卡。不过这张顶级显卡还可以再升级！最近笔者就收到了一张顶尖水准的RTX4090显卡，各方面堪称极致，甚至突破功耗上限，为的就是给极客玩家带来更极致的体验。

熟悉索泰的玩家应该知道，索泰一直有个PGF系列，它是索泰显卡中最顶级的存在，不过这个系列在RTX40系显卡中还没有诞生新成员。今天它来了！一发布就是天花板级别的索泰GeForceRTX4090PGFOC显卡，无论是外观颜值，还是内在用料，它都是当之无愧的非公卡皇，我们也在第一时间上手了这张性能怪兽，下面一起看看它有怎样的恐怖表现~

下文“索泰GeForceRTX4090PGFOC”简称为“索泰RTX4090PGFOC”

规格对比

开始看这张顶级卡皇前，先给它来个详细的身份识别，这张索泰RTX4090PGFOC用上了AD102-301核心，相比原本的RTX4090，应该是做了一些优化。芯片面积还是熟悉的608mm2，当然啦，也因为用的是TSMC4N工艺，因此小小的核心内塞下了763亿个晶体管。至于它与公版RTX4090的区别还是在于功耗和频率的设定上。全新推出的索泰RTX4090PGFOC虽然默认功耗还是450W，但它可以在此基础上上调17%，也就是说600W不成问题。

并且BOOST频率上也有加成，公版的RTX4090为2520MHz，而索泰RTX4090PGFOC的BOOST频率能够去到夸张的2625MHz，足足高了有105MHz！再聊聊它的这颗AD102核心，我们也是总结了目前40系显卡的所有核心，AD102核心可以称得上是地表最强的游戏显卡核心了，384bit位宽、144个SM、96MB的L2缓存……，每一项都在告诉你，它就是最Top的存在。

不过我们从图上的规格表还是可以发现，目前GeForceRTX4090显卡中配备的AD102-300或AD102-301核心其实并非完整的AD102核心。下图展示的为完整的AD102核心，它应该包括了12个GPC(图形处理集群)、72个TPC(纹理处理集群)、144个SM(流式多处理器)和⼀个带有12个32Bit显存控制器的384Bit显存位宽。这也证明了完整的AD102核心是留给未来可能推出的RTX4090Ti显卡的。

再来看下面的GeForceRTX4090架构图，和完整版本的AD102核心对比起来就很容易看出差别。首先，GeForceRTX4090核心代号为AD102-300或AD102-301，其拥有9个完整规格的GPC(图形处理集群，每个内建6个TPC)，与2个非完整的GPC(图形处理集群，每个内建5个TPC)，共组成了64个TPC，SM单元为128个，相比完整版少了16个。至于显存位宽老黄还是手下留情了，保留了完整的384Bit。

外观赏析：索泰 GeForce RTX 4090 PGF OC

见过不少索泰的显卡包装盒，唯独索泰RTX4090PGFOC的包装盒让我眼前一亮。大面积的线条与图形使用和这次的PGF系列设计不谋而合，彰显了“lessismore”的核心主张，给玩家丰富的意象空间。

拆开包装盒，索泰RTX4090PGFOC尽显眼底，不得不说它的外观设计颠覆了我的想象。过往的PGF系列更多采用黑色色调，外观上都是硬核机甲风。这回的索泰RTX4090PGFOC可以说是大刀阔斧的改变，圆润的外壳设计多了许多流线型的柔美，为显卡注入了流动与韵律，打破使用尖锐线条勾勒显卡外观的传统。

索泰RTX4090PGFOC顶级的不止在它的外观设计，体积方面也是Top的存在，足足有2.4kg重，这就是一块有着超强性能的“板砖”

因此为了应对这个重量级的显卡，索泰也在包装盒内附赠了全金属的显卡支架，既美观又能杜绝显卡变形，给予显卡有效保护。少不了的还有电源转接线与RGB线，甚至连说明书都专门做了收纳，细节拉满。

视角回到显卡身上，整张显卡以白色为主打色，中间有黑色的缎带贯穿始终，不过与黑色的风扇恰如其分，黑白撞色设计在视觉效果上既时尚前卫，又带来了一种沉静之感与中和之意，静谧而平衡，同时也暗藏了一丝丝电竞硬核风格，设计相当超前。

细看正面，圆润的外壳下是三把11cm的巨大散热风扇，它们采用双滚珠轴承设计，并且运用了空气动力学原理，增加了风扇厚度，加深风扇外罩，这有利于风流集中，大幅提升散热效率。中间的风扇还机智的采用反向旋转，能够有效减少乱流、降低噪音。

每把风扇的扇叶也有小设计，仔细看可以看到每一片扇叶上都有鳞状仿生条纹，官方称其为盾鳞2.0高压扇叶，扇叶的曲率也有改善，这些小改动可以提高风扇的进风量、风压与风流，让冷空气吹透整个散热鳍片，帮助显卡快速降温。

显卡背面的设计同样惊艳，首先映入眼帘的就是巨型的”PGF”标志，代表了速度、力量和科技三重含义。旁边还有专门的PGFLogo信仰灯点缀，与白色的金属背板结合，颜值拉满。

虽然金属背板设计会给显卡增重，这是因为索泰增加了合金加固骨骼结构部件，但它有利于巩固显卡、不易变型，而且还可以提升散热效能，加上背板末端设有开孔设计，有效加强风扇气流。

索泰的显卡少不了的就是辨识度，顶部是我们熟悉的ZOTAC信仰Logo与NVIDIA显卡特有的GEFORCERTX标识。

显卡供电用的是全新的12VHPWR供电接口，使用一根12VHPWR的电源线就可达到供电需求。如果你没有用上最新的电源，还可以使用随机附赠的4x8Pin转12Pin的电源线转接使用。

转头看看显卡底部，一排排散热鳍片已经快要突出外壳了，可以预见这款显卡的散热相当出色。

显卡底部还可以看到显卡的PCIe金手指，标准的PCIe4.0x16速率，它可以为显卡提供更快的传输速度。

视频输出接口方面配备了3个DP1.4a和1个HDMI2.1，支持4屏显示或最高8K@60Hz的超清输出。

换个角度，再看看它的厚度，74mm，这已经超越了4槽了，果然高端的显卡都有非同寻常的重量。381mm的长度对不少机箱也是一个考验，ITX机箱基本就不要想着能装进它了，大机箱才是它的归宿。

RGB灯效：索泰 GeForce RTX 4090 PGF OC

高贵冷艳的外观大家都看过了，那下面就来点不一样的，相信没有哪个玩家能够拒绝RGB的诱惑吧~

显卡通电后，顶部的索泰ZOTAC信仰Logo灯率先亮起，多彩的变化加上醒目的设计，辨识度算是拉满了。

不过要说这最吸睛的还要看正面的灯带，在三把散热风扇的四周，索泰安排了一圈的RGB灯带，显卡点亮时犹如律动的音符，远望就好像与风扇起舞。在边缘处更是嵌入了一条绵延不绝的灯带，光彩动人。

索泰可不光在正面安排了RGB，在背部也藏了RGB设计，独有的PGFLogo信仰灯与顶部的ZOTACLogo信仰灯相互呼应，共同点缀着这张高贵的卡皇。

每一处角落都不能放过，就连你很少能够见到的显卡侧边也塞下了RGB，支持1600万色ARGB及多种灯效模式。当你在机箱正面看去，格外靓丽。

玩灯那总要可以自定义吧，索泰的FireStorm软件就集成了这个功能，玩家可以用它自定义RGB，在电源接口的旁边还有OPENARGB接口，通过附赠的线即可实现整机灯效同步，实现千变万化的灯效设计，打造专属于你的靓丽显卡。

纯白的外观配上艳丽的灯光效果，相信不少玩家看完都已经芳心暗许了吧，再来个白色的机箱打造白色主题装机，又是一件完美的艺术品。

显卡拆解：索泰 GeForce RTX 4090 PGF OC

索泰RTX4090PGFOC虽然看起来很厚实，不过拆解起来还是相当轻松的，传统的“三明治”结构。卸下金属背板上的螺丝后就可以分离整个散热系统与PCB板。

整张显卡的PCB板就突出“高级”二字，黑色的色调加上合理规整的设计，一眼就能看出它出自大厂之手。正面是各式各样的供电芯片、电感、核心以及显存，密密麻麻铺满了整个PCB板。

再看看它的背部，强迫症看了都直呼舒服，并且索泰还在核心背部电容位置使用了四个POSCAP(导电聚合物钽电容)代替四组MLCC(一组10个MLCC)，整体电气性能更强。

终于轮到我们的主角了，这颗AD102-301-A1核心四平八稳的镶嵌在PCB的正中央。你以为它只是小小的一颗芯片，其实它得益于TSMC4N工艺，在里面塞下了763亿个晶体管，这个数量足足是RTX3090Ti的2.7倍！

核心的周边则是12颗GDDR6X显存，来自美光科技，型号为2RU47D8BZC，单颗显存容量2GB，12颗组成24GB超大显存。并且这几颗显存的速率可是满血的，显存速率为21Gbps。

俯瞰整张PCB，你就可以发现，它的供电规模也堪称豪华，采用了SEP2.0供电系统。供电总相数来到了夸张的28相，其中24相为核心供电，4相为显存供电，并且供电集成度相高，每相均采用了固态电容做输入输出，还有全封闭电感坐镇。

左侧PCB供电

右侧PCB供电

无论是核心供电还是显存供电，索泰均采用了统一规格的DrMos芯片，可见是下了血本了，芯片来自万国半导体，封装型号为BLN0与BLN3，实际应为AOS的AOZ5311NQI与AOZ5311NQI-03，二者持续输出电流均为55A。

核心供电DrMos

显存供电DrMos

PWM主控则位于PCB的背部，型号分别是：uP9512R、uP9512U以及uS5650Q。其中uP9512R与uP9512U共同管理核心供电，可以做精细化的供电管理。

uP9512R

uP9512U

而面积最小的uS5650Q则担任电压/电流/功耗监控的工作。

供电规模的强悍还需要有个接入口，索泰RTX4090PGFOC采用了最新的12VHPWR接口，单口供电能力可达600W，带动这颗“核弹”完全没有问题。

不过供电不止12VHPWR接口一处，PCIe也是供电之一，索泰RTX4090PGFOC的PCIe接口为标准的PCIe4.0x16，值得注意的是使用前一定要在主板打开ResizableBAR功能，这张显卡的性能才能完全释放。

当然，上面提及芯片，PCB上还有众多不可或缺的芯片，例如在核心周围还能看到两颗BIOS控制芯片，型号为IS25WP016，分别控制这款显卡的默认BIOS与极速BIOS。

我们继续拆解它的散热系统，可以看到索泰RTX4090PGFOC承袭了索泰“堆料王”的品质，一眼就见到了超大面积的VC均热板，它能够迅速吸收GPU产生的热量，并将热量迅速均匀传递到热管，让AD102核心时刻保持冷静。

在VC均热板的四周是一片又一片定制的高K导热垫，它们覆盖了显存、电感、MOS感等发热大户，让其与散热模组之间无缝连接，散热的同时还能减少啸叫几率。中间的核心区域则是厚厚的硅脂，给核心专供，如此高规格的配置，为的就是让这款顶级显卡能够全力释放性能。

不仅仅正面的超大VC均热板有散热，金属背板上同样安排了特设高K导热垫，配合金属导热性强的特性，索泰RTX4090PGFOC的散热规格足以用恐怖来形容。

而中间的散热器才是散热系统中体积最大的一个，散热器本体为两段式散热模块，左右两侧均有全覆盖高密度镀镍鳍片，搭配全新对流穿透散热设计，能够大大提升显卡散热效能。

散热鳍片下隐藏着9根冰脉热管，全部采用精密的无损内嵌焊接工艺，热管设计也经过全面升级，增加热管壁厚度和内壁脉络状导液沟槽，还用上了更高导热系数的介质，为的就是给AD102核心满血释放的舞台。

有了不错的热管，还需要风力十足的散热风扇快速带离热量，正面的三个11cm的散热风扇便是最大的功臣。风扇采用双滚珠轴承，盾鳞2.0高压扇叶多达11片，厚度还增加了不少，因此能带来更强的风压和风流，实现无死角风流覆盖，配合显卡内部散热部件拥有更加出色的散热效果。

最后来个全家福，索泰RTX4090PGFOC的内部构造就像富丽堂皇的皇宫，应有尽有。旗舰级的AD102核心、旗舰级的散热规格才对得起旗舰PGF的定位。

测试平台介绍

索泰RTX4090PGFOC的里里外外大家都见证过了，下面就该真刀真枪的上机测试了。还是编辑部的天花板配置，CPU用的是最新的IntelCorei9-13900KS，华硕的Z790Hero主板搭配2根16GB的金士顿DDR5-6000高频内存。

有了强悍的硬件，显示设备也不能拖后腿，显示器我们采用了爱攻&保时捷联名PD32M电竞显示器，其搭载了目前顶级的4K144Hz面板，可以完美体验到RTX4090带来的丝滑4K144Hz游戏体验。

理论性能测试

国际惯例，跑分前先给这张索泰RTX4090PGFOC显卡来个全身体检，从图中可以看到这款显卡的基准频率为2235MHz，Boost频率为2625MHz，远远高于公版FE的2520MHz，足足105MHz的提升，这也是它为什么被索泰称为旗舰之作的原因之一。

再看看它的功耗与温度墙限定，不得不说高端显卡就是非同凡响，索泰RTX4090PGFOC的默认TGP设定为450W，不过这是普通的RTX4090的极限，不是索泰RTX4090PGFOC的极限，它支持解锁功耗，最大TGP可至530W，温度墙也是给到了88℃，看来超频测试是少不了了。

先看看索泰RTX4090PGFOC的基准性能吧，这里选用3DMark作为测试工具，从测试结果中可以看出，索泰RTX4090PGFOC对RTX3090Ti就是碾压，在DX11为基准的FireStrike系列测试中，67806的超高成绩比后者高出仅1W多分，性能提升幅度达到了近20%，而在DX12为基准的TimeSpy中，38122的超高分数同样强过RTX3090Ti的22379分。

不过要说提升最大的就得属光追与老黄引以为傲的DLSS了，在PortRoyal测试中，索泰RTX4090PGFOC领先RTX3090Ti就有23%以上！而在DLSS方面，这张显卡的提升堪称恐怖，2K下开关DLSS可以有超百帧的差距，更离谱的是8K下，仅开启DLSS2也能做到60FPS流畅运行。

而在其他理论性能测试中，索泰RTX4090PGFOC更是王者风范，例如在GPGPU理论中，拥有AdaLovalace架构的RTX40系列显卡在算力上也有出色的性能表现，尤其是单精度和双精度浮点运算上，提升幅度是最大的。索泰RTX4090PGFOC整体性能相比RTX3090Ti的性能提升足足有92%左右，不少项目更是2倍甚至3倍的飞跃，着实让笔者越测越兴奋。

游戏性能测试

再来就是玩家最期待的游戏性能测试了，想必买这张卡的玩家应该都不缺4K显示器吧，这里我们就着重说说它的4K以及8K表现了。不过还是给大家看看它在1080P跟2K的表现，索泰RTX4090PGFOC就是乱杀，大部分游戏都在200FPS以上，这已经不是入门电竞的水平了，而是专业电竞的表现。

重点来了~4K分辨率才是这款显卡的主战场，先挑个优化最差的《赛博朋克2077》试试手，可以看到索泰RTX4090PGFOC显卡在DLSS2下，游戏帧数已经有77FPS，你可能觉得不多，那看看隔壁的RTX3090Ti，48FPS的表现真的不够看，当然你别忘了它还有DLSS3加持，有“大力水手”的加成，帧数还能有不小的飞跃。

8K在以前只能说是幻想，现在它已经成为了现实！在8K游戏测试方面，索泰RTX4090PGFOC显卡能够将大部分游戏跑到60FPS以上，这已经远远超乎笔者的想象，而像一些优化好的游戏，例如《极限竞速：地平线5》甚至能有85FPS左右的表现，这还只是DLSS2的表现，相信加上DLSS3，性能应该更为强悍。

总的来说，索泰RTX4090PGFOC可谓是不负众望，1080P、2K对它犹如砍瓜切菜般简单，4K分辨率下，即使只开DLSS2，依旧有不错的体验，如果你玩的游戏有DLSS3，那体验更是质的飞跃，至于8K嘛，目前的体验只能说良好，基本可玩，后续如果游戏优化得当，8K电竞应该指日可待。

DLSS 3性能实测

提到RTX40系显卡就不得不提DLSS3这个黑科技了，它无疑是这代显卡升级的重点，相比DLSS2，DLSS3不仅可以实现画质于帧数的双向提升，还新增帧生成功能，实现游戏帧数翻倍，老黄在发布会上更是直言“DLSS3让游戏性能翻倍”！

3DMarkDLSS3理论性能测试

还是老样子，先验一下DLSS3的实际理论性能，实测下来有DLSS3的加持下，索泰RTX4090PGFOC显卡相比RTX3090Ti实现了性能的翻倍，在4K分辨率下，不开DLSS3仅能勉强维持在60FPS附近，一旦开启DLSS3后，性能直接提升三倍，180+FPS的惊人表现直接超出RTX3090Ti100多FPS。

8K也是从容不迫，不开启任何DLSS时，强如RTX4090也只有13FPS，不过上面我们也看到了索泰RTX4090PGFOC在DLSS2下，8K已经可以跑60FPS了，如果用DLSS3，拿直接逼近百帧！

游戏实测

光有理论测试，没有实际游戏怎么行，我们这里就用显卡杀手《赛博朋克2077》来“折磨”一下这张顶级卡皇，特别是现在的《赛博朋克2077》还有负载压力更大的全景光追模式，这又是一项挑战。

首先我们先看看在超级光追下的表现，DLSS2下，索泰RTX4090PGFOC的表现已经相当不错了，4K分辨率可以跑到111FPS，这已经能够满足4K@120Hz高刷电竞了；换到DLSS3我们再测一次，144FPS的表现完美诠释了它的旗舰定位，再看看2K或1080P，超200+FPS的成绩更是唬人。

换装上压力更大的全景光追后，我们先在DLSS2下进行体验，不得不说这个级别的光追压力确实大，强如索泰RTX4090PGFOC也只能勉强60FPS运行。至于2K或1080P的表现就会好很多，不过这是一张40系显卡，还有DLSS3这个黑科技，在开了DLSS3后，索泰RTX4090PGFOC在4K分辨率下也能有105FPS的出色表现，虽然比超级光追模式下低了一些，不过全景光追的画面真实度值得你体验！

另外，眼尖的小伙伴应该也发现了，开启DLSS3后，游戏的1%LowFPS均有不同程度的提升，幅度在15-20FPS间浮动，别小看这十几帧的差距，在游戏中，1%LowFPS越高，你的游戏体验就会更丝滑，遇到卡顿的情况就会减少，这也是DLSS3的一大优势。

让我们再看看另一款支持DLSS3的游戏《F122》，索泰RTX4090PGFOC依旧强势，在4K画质下开启全高特效，有了DLSS3的加成，索泰RTX4090PGFOC能够跑到163帧，若只使用DLSS2，则帧数只有85帧左右，相当于DLSS3这个黑科技给游戏带来了50%的游戏性能提升，相当不错。

当然了，DLSS3除了能够有效提升游戏帧数外，画质也是一等一的强，这里我们也截取了DLSS3各个档位下的游戏实际画面，可以看到无论是哪个档次，游戏画质均没有明显影响，甚至因为DLSS3是通过AI进行超分渲染，因此在文字等细节纹理上会比原生画质更加清晰。

DLSS3-F122-DLSS-Balance

DLSS3-F122-DLSS-Perfoemance

DLSS3-F122-DLSS-Quality

DLSS3-F122-DLSS-SuperPerfoemance

DLSS3-F122-TAA

就拿F122内的场景来说，五个不同的档次，画质几乎没有区别，老黄的DLSS3可以说是把RTX40系显卡的游戏体验推到了更高的层级，远远强于上代的RTX30系显卡。

UnrealEngine5LyraDLSS3测试

最后我们还测试了利用UnrealEngine5引擎打造的LyraDEMO，此DEMO除了能够支持最新的DLSS3技术外，还带上了NVIDIAReflex。笔者这里上传了两个图片给大家看看LyraDEMO里的DLSS3开启与关闭的画质对比，游戏流畅度自然是DLSS3开启后提升较为明显的，达到192FPS，而PCL延迟也进一步降低到了50ms的水平。

Unreal-Engine-5-Lyra-DLSS3-OFF

Unreal-Engine-5-Lyra-DLSS3-ON

更多测试

如果你觉得这些还不够过瘾，我们也安排了更多游戏的实测，1080P大家应该不用想也知道，这张卡就是爆杀，这里给大家展示2K、4K以及8K的成绩。

首先是2K分辨率下，开启DLSS2的索泰RTX4090PGFOC相比起前代卡皇已经大幅领先了，一旦开启了DLSS3，这张显卡仿佛脱缰的野马！2K下不少游戏有了300+的帧数表现，看来还是太小看这张索泰RTX4090PGFOC了，4K甚至8K才是它的战场。

提升分辨率至4K，索泰RTX4090PGFOC终于能够大展身手了，开关DLSS2与DLSS3，游戏帧数竟有30-40FPS的差距，这还只是跟它自己比较。如果你用索泰RTX4090PGFOC与RTX3090Ti相比，那简直就是降维打击，超强的性能让它可以4K@144Hz畅玩3A大作。

视频内容创作性能测试

游戏表现可以说是相当的惊艳，那生产力创作上索泰RTX4090PGFOC又有怎样的惊喜！这里我们选择PugetBench、PCMark10、Blender等多款常见的测试软件，来测试这款显卡在日常办公、视频内容生产、专业渲染等方面的性能表现。

首先是PCMark10Extended项目，索泰RTX4090PGFOC显卡在每个项目上都完成了超越，整体性能领先前代的RTX3090Ti达到了15%左右，不过根据我们前面的测试，领先幅度远不止于此，毕竟单是游戏中就是几十上百帧的差距。

而在视频内容创作上，索泰RTX4090PGFOC得益于更快的显存于更强的性能，跑Pugetbench的Pr项目确实比前代卡皇快了很多，有大约30%的性能提升。如果你用达芬奇进行测试，那索泰RTX4090PGFOC的优势会更加明显，毕竟AV1编码是30系显卡不曾拥有的技术，后续我们也会对这部分进行更详细的测试。

专业内容创作性能测试

既然是创作，那除了视频内容当然还有专业的渲染与工业软件，在N卡常用的Blender渲染软件中，索泰RTX4090PGFOC相比RTX3090Ti有97%的性能提升！你没有听错，就是翻倍的性能表现！RTX40系的性能果然不让人失望。

同样出色的还有OC渲染器，索泰RTX4090PGFOC的表现真的是顶级的存在，性能也提升了95%以上，想要提升专业性能的用户不妨考虑一下这张索泰RTX4090PGFOC，顶级的显卡顶级的体验，当然你也将获得顶级的效率。

像SPEX的专业领域我们也没有放过，当然我们的索泰RTX4090PGFOC没有辜负我们的期待，65%的性能提升充满惊喜。这也得益于全新架构的加持，才让这款显卡能够实现如此“变态”的性能提升。

NVIDIA双编码器测试

上面我们也提到了RTX40系列还藏有一项黑科技可以加速你的视频内容创作，其实就是它的第八代NVIDIA双编码器，它支持时下热门的AV1编码，作为下一代主流的视频编码技术有着自己独特的优势，更快的编码速度和更高质量的流媒体传输性能，让越来越多的剪辑软件和视频网站青睐于它，像我们熟悉的达芬奇、剪映、B站等已经支持AV1编解码，未来AV1将会成为一个新趋势。

先看看大家关心的速度，我们选用NVIDIA提供的样片进行导出测试，有第八代NVENC双编码器加持的索泰RTX4090PGFOC确实能带来更好的性能表现，同样是H.265视频输出，它的效率就要比上代显卡快多了；若你是输出8K30的视频，这张天花板级别的RTX4090只需要46秒就能完成了，相比之下隔壁的RTX3090Ti却要170秒，几乎是4倍的效率提升！

另外我们再来看看H.265格式与AV1格式下的画质区别，从肉眼来看，其实画质几乎完全一样，这样也意味着AV1可以用更小的空间占用量实现与H.265同等规格的画质表现，总的来说，无论是导出速度、空间占用还是画质表现，它都完胜H.265。

AI性能测试

AI是现在这个时代的浪潮，不到一年的时间里，AI已经席卷了各行各业，各式各样的AI工具接踵而至。而作为AI时代最大的赢家老黄在GTC上、在COMPUTEX2023上都大谈AI，甚至说“现在就是AI的iPhone时刻”，甚至为了让大家感受AI的魅力，进一步推出了一系列AI产品与服务，震撼全场。

借着这个机会，我们也对索泰RTX4090PGFOC显卡进行AI运算能力测试，在使用达芬奇AIACCELERATEDMAGICMASK测试时，同一项目下，架构革新后的索泰RTX4090PGFOC有着更快的渲染时间，原本RTX3090Ti需要几十秒才能完成的操作，现在仅用17秒！

要说测AI又怎么能够少得了生成式AI中最经典的StableDiffusionAI画图呢，拥有24GB超大显存的索泰RTX4090PGFOC显卡可以说是这里的最强王者！选择NVIDIA提供的描述，生成50张768x768的图片，索泰RTX4090PGFOC以1分钟19张图的速度一骑绝尘，作为对比，上代的RTX3090Ti则是一分钟11张图，可见架构革新确实能够带来不小的性能提升，换用新的RTX40系显卡也能让你在AI时代乘风破浪。

RTX VSR测试

AI的能力大家看完了，再给大家看个有意思的。素有视频版DLSS的RTXVideoSuperResolution视频超分辨率技术（RTXVSR）终于上线了。在RTX4090上市那会儿，这项技术还没发布，现在刚好有索泰RTX4090PGFOC显卡，那就用这张显卡看看，顶级的性能加上超强的AI技术，究竟能不能将低分辨率的视频也提升到前所未有的效果。

首先开启RTXVSR需要你的显卡为30系或40系，在NVIDIA控制面板中找到视频图像设置，手动开启RTXVideoenhancement即可启用RTXVSR技术，其中分为1-4档调节，数字越大质量越好。

实测环节，可以看到在开启RTXVSR技术之后，原视频里的人物线条由原本的模糊不清变得十分清晰锐利，甚至部分细节已经超越原生1080P了，并且低画质的视频也有不少噪点，在开启VSR4档后，噪点几乎消失。

除此之外，由于是AI智能提升分辨率的缘故，字体在原生的480P视频中有些发虚，甚至字体边缘可以看到毛边，不过有了VSR的加持后，字体锐利可见，完全不输原生1080P的效果，不得不说VSR确实有点东西。

这里我们也给大家准备了对比视频，从视频里就可以看到VSR的效果之明显，最高级别的VSR4跟原生480P相比就是一眼的区别，在开启RTXVSR技术后，部分图像质量有了显著提高，不仅锯齿和噪点几乎全部消失，颜色过渡也更为平滑，目前VSR能有这种表现堪称惊艳。

左：原生480P中：VSR4档右：原生1080P

当然你除了在浏览器能够使用这项功能外，本地浏览器也能享受黑科技的魅力，VLC是目前首个支持RTXVSR技术的本地播放器，且能够支持多种视频格式播放，你硬盘里的老视频也能拥有清晰画质了！

我们将本地的360P画质视频进行RTXVSR4档渲染，从画面上看，开启了VSR技术后，右侧的渲染视频确实比左侧原生的视频要清晰许多，并且肉眼可见噪点的减少，观感上要明显好于原生的360P视频。

如果你想知道本地VSR的效果，这里也有视频可以看到二者的差距，确实能够明显看出有VSR的加持后，不少细节重新清晰可见，对一些低分辨率视频确实有提升。

左：本地原生360P右：VSR-4档

总的来说，索泰RTX4090PGFOC上的RTXVSR技术还是相当不错的，既有不错的观感，又有合适的功耗，有了这项全新的技术，将为玩家和视频观看者带来革命性的新体验！

超频潜力测试

可以解锁功耗的RTX4090，那怎么能少得了超频呢，索泰RTX4090PGFOC显卡，无论是散热配置还是性能释放，都是顶级中的顶级。这里我们将使用索泰的FireStorm控制中心对显卡进行超频，这款软件不仅能够用于超频，还能轻松控制显卡BIOS、灯效调节、查看显卡状态等。

查看显卡信息

超频与BIOS切换

风扇转速调节

在解锁显卡的功耗限制与温度墙后，我们将GPU核心和GDDR6X显存同时超频，在FireStorm中将这款显卡的BOOST频率提升到2725MHz，相比默认状态拉高了100MHz，此时显卡依旧稳定运行，在3DMark的TimeSpy测试中，显卡得分39099，比默认状态好出不少。

我们继续尝试，在FireStorm中我们将GPU核心频率提升50MHz，FireStorm中显示，这款GPU的Boost频率已经有2775MHz了。继续尝试TimeSpy测试，索泰RTX4090PGFOC顺利完成，得分39325分，再度刷新记录。并且功耗稳定在480W左右，散热也维持在良好的水平，核心仅有60℃不到。

最后我们也是尝试了更高的频率，成功将索泰RTX4090PGFOC的GPU核心频率提升了190MHz，显存频率提升了1000MHz。在3DMark中这款显卡能够稳定运行在3075MHz下，要知道，这还只是在风冷状态下，如果是水冷，那它还能再高一些，此时TimeSpy测试得分39975，仅差一步之遥就可冲上4W大关。并且相比默频状态的38122分提高近2000分，超频潜力可见一斑。

功耗与发热测试

超强的超频潜力，缘于索泰RTX4090PGFOC极致的散热配置，最后我们就来试试这款显卡的散热性能表现~

在使用Furmark烤机15分钟后，这款显卡的GPU温度稳定在65.7℃，这样的成绩比起上代的RTX3090Ti可以说是质的飞跃，如果跟其他RTX4090比起来，那也是妥妥的第一梯队，可见其散热效率的确非常高。

除了核心，显卡内还有个发热大户——GDDR6X显存，不过从实际情况来看，显然是我多虑了，有了高系数的导热垫和直触均热板设计后，显存的温度仅仅只比核心高了一点点，66℃的表现，放在前代显卡中，那就是鹤立鸡群的存在，30系显卡看了都是无法企及的高度。

众所周知，这是一张功耗可以干到530W的旗舰显卡，那实际使用中，会不会功耗爆炸？这里我们还利用HWINFO64软件与FrameView软件双重记录多款显卡的功耗表现情况，从图中可以看到索泰RTX4090PGFOC的功耗控制相当出色，测试的多款软件与游戏中，功耗都维持在400W附近，功耗表现远低于上代的RTX3090Ti。

就看这个表现，你就说索泰RTX4090PGFOC牛不牛吧！用更低的功耗实现更强的性能，完全吊打上代卡皇，这才是顶级RTX4090应有的表现。老黄的AdaLovelace架构配合TSMC的4N工艺，40系的功耗比堪称逆天！

评测总结

测完索泰GeForceRTX4090PGFOC，只剩一句赞叹“顶级旗舰之所以顶级，是因为在各个方面都做到了顶尖水准”，用这句话形容这张显卡一点都不为过。而全新的AdaLovelace架构、TSMC4N制造工艺、DLSS3、RTXVSR等黑科技也是悉数登场，给这张顶级的显卡又披上了强劲战甲，让它的性能达到了前所未有的高度。

在我们的实测过程中，就能感觉到索泰GeForceRTX4090PGFOC的不一般，无论是性能、颜值、还是配置都是当今最强的RTX4090之一。单就游戏表现来说，它不仅能够满足你的4K高刷体验，甚至8K也有一战之力。散热更是一绝，超强的效能造就了极致的超频的潜力，不过28相豪华供电也功不可没，这都是它能够站在性能顶峰的强势资本。

再聊聊它的外观，这回的索泰GeForceRTX4090PGFOC可以说变了也可以说没变，变的是相比前代的PGF系列，采用了更前卫的设计理念，不变的是继承了AMP系列的设计风格，圆润的外观在这个棱角分明的时代，可谓是赚足了眼球，白色的机身设计更符合时下的潮流，颜值党看了都直呼过瘾。

总的来说，索泰GeForceRTX4090PGFOC显卡既是自家旗下的顶尖之作，也是目前的地表王者。如果你也想感受一下卡皇的威力，那它就是你的最佳选择。目前索泰GeForceRTX4090PGFOC已经上市，售价16999元，感兴趣的话可以去了解一下。

Ada Lovelace架构讲解

Turing、Ampere上两代架构核心均以人物来命名，前者是计算机科学之父——艾伦·麦席森·图灵；后者则是“电学中的牛顿”——安德烈·玛丽·安培，电流的国际单位安培就是以其姓氏命名。那AdaLovelace定非凡人，度娘一下果然，这是人称“数字女王”的阿达·洛芙莱斯，编写了历史上首款电脑程序，是被世界公认的第一位计算机程序员，果真是一代比一代还要更牛。PS：她的父亲是《唐璜》的作者，诗人拜伦喔。

从Turing架构开始，NVIDIA首次在显卡中加入了加速光线追踪的RTCore单元，以及面向AI推理的TensorCore单元，这革命性的创新使实时光线追踪成为可能。而Ampere架构则是全面的架构改进，在加入新一代的二代RTCore和三代TensorCore基础上，还有着更先进的SM单元设计，这样显卡工作效率那是翻倍的提升。而来到AdaLovelace架构，同时是以效率提升为大前提，自然是引入了最新的第三代RTCores与第四代TensorCores单元，同时加入众多新颖的黑科技，从执行效率来说AdaLovelace架构是上代Ampere架构的2倍以上，甚至光线追踪能力更是达到了恐怖的4倍性能。

在讲述核心架构前，我们先了解几个关键词：GeForceRTX4090、AdaLovelace、TSMC4N、608mm²、760亿个晶体管、2倍性能功耗比。

大家带着几个关键字来看上面的【显卡规格参数对比】表格，就可以更容易读懂上述表格了。最新一代的桌面显卡GeForceRTX40系列均采用全新的AdaLovelace架构核心，GeForceRTX4090的核心是AD102，目前AdaLovelace架构核心中最为强大的，具有760亿个晶体管、16384个CUDA核心和24GB高速美光GDDR6X显存。

得益于NVIDIA与台积电深度合作的TSMC4N制程工艺，GeForceRTX4090核心面积仅是608mm²（上代RTX3090Ti628mm²），在更小的核心面积下却能塞下多达760亿个晶体管，比上一代的Ampere架构多出了约70%晶体管数量。

值得注意的是，制程工艺的提升不单能拥有更多的晶体管，其核心频率更是能跑得很高，GeForceRTX4090Boost频率就已经达到了2520MHz，这样在核心频率与高规格的双向保证下实现了比上代显卡高达2倍的性能功耗比。

如果你还是不太懂，这里笔者就逐一为了AdaLovelace架构显卡的构成。

刚才我们已经说到，一个完整的AdaLovelace架构AD102核心内部拥有12个GPC，而每个完整的GPC中包含了一个专用的RasterEngine（光栅化引擎），两组ROPs共16个ROP（光栅化处理单元），以及6个TPC与12个SM单元。

全新的SM流式多处理器

AdaLovelace架构中最大的亮点之一：全新的SM流式多处理器，每个SM包含了128个CUDA核心、1个第三代的RTCores,4个第四代TensorCores（张量核心）、4个TextureUnits（纹理单元）、256KBRegisterFile（寄存器堆），以及128KBL1数据缓存/共享内存子系统，于是这一个全新的SM单元有着超过上一代2倍之的性能表现。

过去的Turing架构INT32计算单元与FP32数量是一致的，而两者相加才组成了64个CUDA核心。但是Ampere架构开始，左侧的计算单元实现了FP32+INT32的计算单元并发执行，也就是说CUDA核心数量翻倍到了128个。

再来看看AdaLovelace架构的SM，FP32/INT32的计算单元组合，同样实现了每个SM内含128个CUDA的设计，看似提升不大，但是当你了解到GeForceRTX4090拥有128个SM，16384个CUDA核心，那你也就应该明白达82.6TFLOPS的着色器能力是如何实现的了，比上一代的RTX3090Ti显卡的40TFLOPS，还真是提升了两倍有多。

另外缓存方面AdaLovelace架构也进行了大规格的提升，首先每个SM单元中单独配上了128KB的缓存，这样RTX4090显卡中就实现了163MBL1/共享内存。其次核心的二级缓存进行进行了重新的设计，并且完整AD102核心是96MB二级缓存，而RTX4090显卡拥有72MB二级缓存，也可能是因此AdaLovelace架构核心对显存位宽的依赖性并不高。

技术讲解：第三代RT Cores与第四代Tensor Cores

以为刚才的CUDA数量与超大L2缓存就已经很猛了，实现上AdaLovelace架构最大的提升还是在第三代RTCores与第四代TensorCores身上。

第三代RTCores

RTCores用于光线追踪加速，第三代RTCores的有效光线追踪计算能力达到191TFLOPS，是上一代产品2.8倍。

在Ampere架构中，第二代RTCores支持边界交叉测试（BoxIntersectiontesting）和三角形交叉测试（TriangleIntersectiontesting），用于加速BVH遍历和执行射线三角交叉测试计算，虽然光线追踪处理能力已经比初代的Turing架构核心更高效，但是随着环境和物体的几何复杂性持续增加，传统的处理方式很难再以更高效率、正确反应出的现实世界中的光线，尤其是光的运动准确性。

所以在第三代RTCores增加了两个重要硬件单元：OpacityMicromapEngine与DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine，主要是用于alpha通道的加速，可以将alpha测试几何体的光线追踪速度提高2倍。

在传统光栅渲染中，开发人员使用一些Alpha通道的素材来实现更高效的画面渲染，例如Alpha通道的叶子或火焰等复杂形状的物体。但在光线追踪时代，这传统的做法会为光线追踪带为不少无效的计算，例如运动性的光线多次通过一块叶子，光线每击中一次叶子，都会调用一次着色器来确定如何处理相交，这时就会做成严重的执行成本与时间等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光线交集的不透明度状态三角形。根据Alpha通道的不透明，透明与未知等三个不同的块状态进行处理：透明则直接忽略继续找下一个，不透明块则记录并告之命中，而未知的则交给着色器来确定如何处理，这样GPU很大部分都不需要进行着色器的调试处理，能够实现更为高效的性能。

DisplacedMicro-MeshesEngine

如果说OpacityMicromapEngine加速的是面处理，那么DisplacedMicro-MeshesEngine就是几何曲面细节的加速器。如上图所示，在AdaLovelace架构中，通过1个基底三角形+位移地图，就可以创建出一个高度详细的几何网格，所需要资源占用比二代RTCores更低，效率也更高。

通过NVIDIA给出的创建14:1珊瑚蟹例子来说事，这里我们需要需要1.7万个微网格、160万个微三角形，在AdaLovelace架构中BVH创建速度可加快7.6倍，存储空间缩小8.1倍。DisplacedMicro-MeshesEngine起到了关键性的作用，其将一个几何物体根据不同细节分成密度不一的微网络处理，红色密度超高，细节处理越为复杂。相应的低密度微网络区域则可以释放更多的资源与存储空间，这样DisplacedMicro-MeshesEngine就可以帮助BVH加速过程，减少构建时间和存储成本。

同时AdaLovelace架构SM中新增了着色器执行重排序（ShaderExecutionReordering，SER），这是由于光线追踪不再只有强光或者阴影渲染处理，未来将会更多的是在光线的运动性，这样光线就会变得越来越复杂，想要第三代RTCores与第四代TensorCores有着更高的执行效率，那就得为他们来安排一位管家。而着色器执行重排序（SER）就是为了能够即时重新安排着色器负载来提高执行效率，为光线追踪提供2倍的加速，也能更好地利用GPU资源。不过目前仍未有实例，想实现这个功能，还得游戏与开发工具的支持才行。

第四代TensorCores

TensorCores是专门为执行张量/矩阵运算而设计的专用执行单元，这些运算是深度学习中使用的核心计算功能。第四代TensorCores新增FP8引擎，具有高达1.32petaflops的张量处理性能，超过上一代的5倍。

技术讲解：DLSS 3

或者说第四代TensorCores太硬核你不会知道是啥？提升意义在哪？但是TensorCores最经典的应用DLSS你肯定会知道，这一次AdaLovelace架构支持NVIDIA最新的DLSS3技术。

之前我们也聊过DLSS技术，其设计之初是为了弥补光线追踪技术后的性能损失，具体的表现为开启光线追踪技术后游戏帧数大幅度的下降，甚至很难保证游戏流畅的运行。于是DLSS使用低分辨率内容作为输入并运用AI技术输出高分辨率帧，从而提升光线追踪的性能。

在DLSS3中包含了三项技术：DLSS帧生成、DLSS超分辨率（也称为DLSS2）和NVIDIAReflex。你可以理解为DLSS3是在DLSS2的基础上，新增了DLSS帧生成技术；而后两技术中，DLSS超分辨率只需要GeForceRTX显卡都能使用上，NVIDIAReflex则是GeForce900系列以后的显卡都用使用上。

想实现DLSS帧生成可不简单，这需要配合上AdaLovelace架构的GeForceRTX40系列显卡才行。DLSS帧生成技术原理是：利用AI技术生成更多帧，以此提升性能。DLSS会借助GeForceRTX40系列GPU所搭载的全新光流加速器分析连续帧和运动数据，进而创建其他高质量帧，同时不会影响图像质量和响应速度。

从Ampere架构开始，NVIDIA显卡就已经支持了光流加速器，而AdaLovelace架构的光流加速器升级到了第二代，其提供了高达300TeraOPS(TOPS)，比安培架构的初代光流加速器（OpticalFlowAcceleration，OFA）快2倍以上。为了实现DLSS帧生成，OFA扮演了重要的角色，其配合上新的运行⽮量分析算法在DLSS3技术框架内实现精确和高性能的帧生成能力。

另外，由于DLSS帧生成是在GPU上作为后处理执行的，那么即使在游戏受到CPU性能限制的时候，我们同样能够从中获得更好的游戏性能提升。尤其是那种物理计算密集型的游戏或大型场景游戏，DLSS2均可以让GeForceRTX40系列显卡以高达两倍于CPU可计算的性能来渲染游戏。

最后由于DLSS3是建立在DLSS2基础之上的，游戏开发者可以在已支持DLSS2或NVIDIAStreamline的现有游戏中快速集成该功能，所以DLSS3已在游戏生态得到广泛应用，目前已有超过35款游戏和应用即将支持该技术。

阅读小亮点：NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一环，它可以使GPU和CPU同步，确保最佳响应速度和低系统延迟。

想要实现端对端的最低延迟，你需要确保游戏、显示器以及鼠标三者都同时支持并开启了Reflex技术。

当GeForceRTX40系列显卡和NVIDIAReflex搭配上后，直接达到1440p分辨率360FPS的体验，这着实是性能有点强劲了。

在GTC2022大会时已经透露将会还有4款1440p分辨率的新型G-SYNC电竞显示器将要发布，包括采用mini-LED技术的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款显示器刷新率均为300Hz，而最猛的是ASUSROGSwift360HzPG27AQN，刷新率直接来到了360Hz。

但唯一一个问题就在于，部分显示器厂商认为此类产品受众人群较少，会降低此类显示器的产能，甚至产品就已经被内部PASS掉，所以1440p360Hz是很美好，但现实也是相当的骨感。

技术讲解：双NVIDIA编码器（NVENC）

GeForceRTX40系列显卡还有一个全新的升级，那就是双编码器NVENC。第八代的NVENC双编码器不仅支持H.264与H.265，还支持开放式视频编码格式AV1。

而由于AV1是一种免版税的视频编码格式，上游软件厂商与下游戏的配套端都在大力推广此编码格式，我们也会看到越来越多的硬件与软件支持AV1格式，包括剪映专业版、DaVinciResolve、以及AdobePremierePro较为流行的Voukoder插件均支持，且均可通过编码预设使用双编码器，这样我们等待视频导出的时间缩短将近一半。

不单是视频制作软件，AV1格式也将会是主播、游戏直播UP主们的新宠儿，在保证画面最高质量的情况下，AV1编码器可将效率提高40%，同时显卡的占用也更低。包括OBSStudio一一代软件中也会增加AV1格式的支持。另外我们还能通过GeForceExperience和OBSStudio录制高达8K60的内容，这样我们做游戏录制也会变得更为轻松。

包括我们之后测试时使用的游戏内录视频都是支持AV1格式，同时双编码器NVENC在资源占用和适配上做得越来越好。

电脑装配网

不惜堆料的旗舰“芯”王，索泰 GeForce RTX 4090 PGF OC显卡评测

人阅读 | 作者xiaofeng | 时间：2024-05-23 17:48

相关文章