NVIDIA在9月20日发布了基于Ada Lovelace架构的RTX 40系列GPU,具备第三代RT Cores和第四代Tensor Cores,而且还带来了全新的DLSS 3黑科技,游戏体验相对上代成倍提升。目前RTX 4090已经发售一段时间,而现在我们终于迎来了RTX 4080。作为RTX 40系列目前的次旗舰,RTX 4080也具备Ada Lovelace架构的一系列新特性,当然也包括可以让游戏的视觉效果与帧率大幅提升的DLSS 3,而价格方面则相对更甜品一些。华硕ROG作为NVIDIA的核心合作伙伴,也在第一时间推出了RTX 4080显卡产品,其中的ROG Strix GeForce RTX 4080 OC Edition 16GB堪称豪华用料的超公版代表,下面我们就一起来详细了解一下这款产品吧。
Ada Lovelace架构全面提升,RTX 4080定位甜品级旗舰
在之前RTX 4090首发测评中,我们已经针对NVIDIA Ada Lovelace架构进行了非常全面的解析(需要了解的朋友可以查阅我们公众号的文章),这里就简单回顾一下RTX 40系列GPU的技术创新点。
RTX 40系列独家支持的重磅黑科技DLSS 3,通过光流加速器实现光学多帧生成,实现游戏帧率的巨幅提升
●全新设计的流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上代产品2倍。
●第三代 RT Cores 有效光线追踪计算能力达到 191 TFLOPS,是上代产品的 2.8 倍。
●第四代 Tensor Cores 新增FP8引擎,具有高达 1.32 PFlops 的张量处理性能,超过上代 5 倍。
●支持着色器执行重排序(SER),通过即时重新安排着色器负载来提高执行效率。SER可为光线追踪带来最高3倍的性能提升,整体游戏性能可最高提升 25%。
●新增Ada光流加速器带来2倍的性能提升,使DLSS 3能够预测场景中帧和帧之间的运动变化,让神经网络能够在保持图像质量的同时提高帧率。
●架构进行大幅改进,采用TSMC定制4N工艺,此工艺专为GPU优化,实现高达2倍的能效飞跃。
●12GB显存及以上型号提供双NVIDIA编码器(NVENC),可最多缩短一半的视频导出时间,并提供了对AV1的硬件编码支持。
那么RTX 4080作为RTX 40系列的次旗舰,规格如何呢?RTX 4080采用了AD103芯片,相对RTX 4090的AD102进行了一些削减,它具有 9728个CUDA 核心,可提供 49 Shader-TFLOPS 传统光栅渲染能力;304个第四代Tensor Cores 为AI处理和DLSS提供780 Tensor-TFLOPS的计算性能;76个第三代RT Cores具有113 RT-TFLOPS的计算性能,为下一代光线追踪提供强劲动力;配备256` bit/16 GB美光GDDR6X显存。根据官方数据来看,RTX 4080的性能最高可达RTX 3080 Ti的2倍,而功耗则降低了近10%。当然,RTX 4080也具备Ada Lovelace架构的多项技术,包括着色器执行重排序(SER)、第三代 RT Cores 以及DLSS 3。
此外,细心的玩家也许注意到RTX 4080的RT Cores/Tensor Cores/TUs数量甚至要比RTX 3080 Ti少一些,显存位宽也要低一些,那它是怎么做到性能反而更高的呢?前面已经说过了,RTX 4080的SM单元经过了进一步优化且支持SER技术,同时RT Cores与Tensor Cores都要高出一代,效率自然不可同日而语,此外GPU的二级缓存也比RTX 3080 Ti高出近10倍,核心频率更是高出50%以上,综合这些因素,RTX 4080最终的性能其实是远远超过RTX 3080 Ti的。而在TGP方面,RTX 4080设定为320 W,比RTX 3080 Ti还低30 W,可见其先进的制程确实带来了极高的能效比。
接下来让我们先看看ROG Strix GeForce RTX 4080 OC Edition 16GB显卡实物。
赛博之力加持的电竞装备
如果说TUF系列是一直以来都是走“硬派军规”路线,那这代ROG Strix显卡可以称得上是“赛博旗舰”,相信看过我们之前RTX首发测评的玩家肯定对它信仰炸裂的造型印象深刻,而ROG Strix RTX 4080 OC在外观上几乎完全复刻了ROG Strix RTX 4090 OC。它相比上代产品更加方正,转角处都有圆滑处理,即使体形依旧很夸张,但却不显得呆板臃肿。
显卡的外观设计加入了大量赛博朋克世界观的元素,表面采用极具特色的红蓝渐变配色,显卡左上角有图腾化的ROG信仰Logo,配合散热风扇上自带霓虹效果的“玩家之眼”,在展现电竞信仰之力的同时,也足够年轻化,机能感十足。新一代的Aura Sync神光同步信仰灯效设计在了尾部和侧边Logo处,尾部的环形灯带很有特色,开启神光同步灯效后,绚丽的霓虹色彩让显卡的整体感官更加丰富,展现出迷人的赛博氛围。
为了应对RTX 4080的发热,ROG Strix RTX 4080 OC和RTX 4090一样采用全新的散热模组设计,配备全包围式散热面板、背板和压铸金属框架,使用了力学性能更好的ADC 10高硬度铝合金材料,大幅增强显卡扛变形的能力。3.5槽大规模散热系统能提供更大的散热空间和更多的散热鳍片,内部采用均热板直触与热管内埋设计,内置四个8毫米和三个6毫米热管,根据官方资料,其在承受500W的热负载时,温度可以再降低5℃。
自带可以“变身”为螺丝刀的显卡支架
新升级的Axial-tech 7扇叶双滚珠轴流风扇,能够比ROG Strix GeForce RTX 3090的上一代风扇多提供23.8%的气流和19.3%的风压,整体散热性能更强。其具备中间风扇反转设计,有效减少扰流,提升散热气流利用率。该风扇支持0dB技术,可以在GPU核心温度低时完全停转,减少低负载时的噪声。显卡尾部还具备两个PWM FanConnectⅡ接口,玩家可以根据需求连接风扇,提升整体散热性能。
供电部分,ROG Strix RTX 4080 OC采用18+3超合金数字供电方案,GPU部分使用了MP2888A控制芯片+TDA21570(70A)MOSFET,显存部分使用UP9529QQKF+SIC6389(50A)供电方案。另外,ROG Strix RTX 4080 OC也采用了华硕全自动化制程技术,可以有效消除生产中的人为失误,让PCB背板更为平滑,带来更高的耐用性。辅助供电部分采用搭载单16pin接口,显卡附带了一根3×8Pin的转接线,方便老电源用户使用。
接口部分,ROG Strix RTX 4090 OC配备高强度不锈钢挡板,并提供了3个DP 1.4接口和2个HDMI 2.1接口,满足玩家组建多显示器系统和8K分辨率、高刷新率显示器的需求没有任何问题。
规格方面,ROG Strix RTX 4080 OC显卡采用了RTX 4080核心,拥有9728个CUDA核心,支持PCIe4.0,显存为16GB GDDR6X,频率为22.4Gbps。得益于扎实的用料以及规格强悍的散热器,显卡的默认频率就达到2625Mhz,加速频率为2655MHz,相比公版频率高出不少(公版为2510MHz)。
性能释放太狂暴!ROG Strix RTX 4080 OC远超RTX 3080Ti
测试平台
显卡:ROG Strix GeForce RTX 4080 OC Edition 16GB
处理器:Intel酷睿i9 13900K
主板:ROG MAXIMUS Z790 HERO
内存:Kingston FURY Renegade RGB 32GB DDR5
硬盘:Kingston KC3000 2TB
电源:ROG THOR雷神1200W Platinum II
操作系统:Windows 11专业版
测试中我们解锁处理器功耗墙,并开启BIOS中的Resize BAR选项。内存选择XMP DDR5 6000模式,分频设定为自动,此外,还选用了RTX 3080 Ti与RTX 4080进行对比。基准性能测试部分,除了FireStrike EXTREME,ROG Strix RTX 4080 OC在其他DX11和DX12项目中的成绩都领先RTX 3080 Ti大约49%。光追项目DXR的成绩为85.13fps,比RTX 3080Ti高出56%,Port Royal中也有45%的领先幅度。本次测试中我们加入了最新的DLSS 3功能测试,DLSS 2K分辨率测试中,RTX 4080在开启DLSS的情况下比开启DLSS的RTX 3080Ti提升45%,而在DLSS 3 4K分辨率测试中则领先RTX 3080T一倍以上。比较令人惊喜的是,RTX 4080在DLSS 3测试项目中,相比关闭DLSS时的性能提升了4.2倍之多。RTX 4080的基准性能大约为RTX 4090的70%~77%,和它的芯片规模是比较符合的。
接下来我们进入实际的游戏测试,首先是传统的光栅化游戏。在2K分辨率下,ROG Strix RTX 4080 OC平均帧率相对RTX 3080 Ti提升了35%左右。随着分辨率来到4K,领先幅度达到了36.5%,部分游戏中的提升高达52%,《控制》《看门狗:军团》这样要求较高的游戏,RTX 4080也能在4K下跑出近90fps左右的流畅帧率,可见其性能确实非常强悍。
光追游戏性能测试中,RTX 4080的领先优势继续扩大,在2K分辨率下,都保持了21%~52%的优势,平均提升幅度达到40%。4K光追中我们加入了DLSS项目,可以看到,在原生4K分辨率下,RTX 4080的平均提升幅度为42%。打开DLSS之后,RTX 4080可以在4K极限光追设置下让所有测试的游戏大作保持非常流畅的帧率,在支持DLSS的9款游戏中,有5款游戏的帧率在开启DLSS后都超过了100fps。
总的来说,RTX 4080不论在光栅游戏还是在光追游戏中都有着出色的性能表现,平均性能领先RTX 3080 Ti 40%以上。而在4K最高画质的光追游戏中,有了DLSS的加持,主流3A大作都可以实现100fps甚至更高的流畅帧率,可以说彻底“征服”了4K游戏。由此可见,RTX 4080凭借先进的Ada Lovelace架构、极高的频率加上第三代RT Cores,提供了远超上代的光追计算效率,同时依靠第四代Tensor Cores带来了更好的DLSS性能,让它成为了新一代的4K光追游戏利器。
DLSS 3是RTX 40系列的重点技术,新增的光流加速器配合DLSS 3技术可以大幅提升帧率并降低帧延迟。在RTX 40系列发布之后,众多DLSS 3游戏也陆续到来,目前已有10款DLSS 3游戏发布,包括《瘟疫传说:安魂曲》、《光明记忆:无限》、《毁灭全人类2:重新探测》、《暗影火炬城》、《F1 2022》、《逆水寒》、《生死轮回》、《漫威蜘蛛侠:重制版》、《微软模拟飞行》和《超级人类》。此外《WRC Generations》、《极品飞车:不羁》和《战锤40K:暗潮》在RTX 4080推出后不久就会发布,这次我们选取了其中几款进行了测试。
从上面的测试成绩我们可以看出来,RTX 4080开启DLSS 3后的帧率提升巨大。大部分游戏在DLSS 3的加持下,其帧率都可以达到原生分辨率的2倍以上,与开启DLSS 2性能模式的RTX 3080 Ti相比,普遍可以提升50%~90%的帧率。比如使用4K超级光追预设的《赛博朋克2077》,开启DLSS 3性能模式后,帧率直接从31fps暴增至114fps,帧率比RTX 3080 Ti提升了近一倍。相比之下,DLSS 3技术给《微软飞行模拟》带来的收益更为明显,游戏开启DLSS 3性能模式后可以达到172fps,相当于在DLSS 2的基础上再提升了69%的帧率,实现了4K电竞级帧率。
DLSS 3的光学多帧生成实现了更高的游戏帧率,并通过Reflex有效降低了延迟,在所有测试的游戏中,开启DLSS 3的情况下,PCL延迟都远低于4K原生设置的。因此,如果用RTX 40系显卡玩支持DLSS 3的游戏,我们强烈推荐打开DLSS 3,以获得画面细节更丰富、帧率更高,操控延迟更低的丝滑流畅游戏体验。
DLSS 3画质方面,从《赛博朋克2077》的截图可以看到,即便是DLSS 3性能模式,画面细节方面和原生也几乎没有什么差别,质量模式更是完全看不出差别了。玩家完全可以放心开启DLSS 3,同时享受精美的画面与流畅的帧率。
RTX 4080具备16GB GDDR6X超大显存,同时拥有双视频编码器,除了游戏之外,自然也是非常优秀的生产力工具。从测试结果可以看到,RTX 4080相对于RTX 3080 Ti,在大多数渲染测试项目中都有40%以上的性能提升。而有了双编码器的加持,RTX 4080的视频转码表现更加惊人,4K转码速度比RTX 3080 Ti快1倍以上,处理8K视频也快了76%,RTX 3080 Ti没有搭载对应的编码器,所以不支持AV1硬件编码。利用显卡AI计算的达芬奇MagicMask魔法遮罩功能中,RTX 4080效率提升提升近65%,平均性能大约达到了RTX 4090的73%。此外,我们发现,RTX 4080 OC的4K转码速度和RTX 4090保持一致,在AV1转码测试项目中和RTX 4090的差距也非常小,都在2%以内,如果是作为剪辑用途,RTX 4080的性价比是相当不错的。
功耗温度与超频测试
RTX 40系列采用了TSMC 4N制造工艺,频率和能效都相对上代大幅提升,当然这也给显卡的散热系统带来了巨大的压力。不过ROG Strix RTX 4080 OC强悍的7热管、3风扇的3.5槽散热器能够轻松压制RTX 4080,释放性能潜力。在室温26℃的环境中,使用Furmark连续考机30分钟,默认考机功率可以跑到353W,GPU温度最高65℃,散热表现比较不错。
ROG Strix RTX 4080 OC默认加速频率为2655MHz,在游戏中的最高频率实测则可达2865MHz。此外,我们也对其进行了简单的超频,在不调节电压的情况下,ROG Strix RTX 4080 OC的频率可以较为轻松的达到3090MHz,此时TGP也接近350W,而工作温度只是稍有上升,凭借高规格的供电设计和散热系统,技术玩家完全有机会冲击更高频率。
总结:4K光追极致利器,发烧游戏玩家的强力选择
ROG Strix RTX 4080 OC搭载了全新RTX 4080 GPU,第三代RT Cores和第四代Tensor Cores为次世代游戏和应用带来了更加强悍的光线追踪性能表现,全新加入的光流加速器,让DLSS3技术的AI帧生成得以实现。而RTX 4080作为RTX 40系列的次旗舰,从实测来看在DLSS的加持下可以轻松实现4K分辨率下的高帧、极致光追游戏,在支持DLSS 3的游戏中帧率提升更是惊人。此外,具备16GB大显存的RTX 4080在3D渲染输出与视频剪辑方面相对RTX 3080 Ti也有巨幅的性能增幅,特别是视频编码性能甚至做到了翻倍。
在超公版RTX 4080中,ROG Strix RTX 4080 OC不但拥有豪华的用料、强悍的散热设计,还有着不错的超频潜力。对于追求极致游戏体验的发烧玩家和追求效率的设计师用户来说,ROG Strix RTX 4080 OC是值得优先考虑的强力选择。