自Turing图灵架构伊始(即GeForce RTX20系列),NVIDIA 显卡正式进入RTX实时光线追踪及DLSS深度学习超级采样技术时代。回顾当初,质疑声音不少,光追效果一般,DLSS折损画质,支持的游戏屈指可数。在接下来的日子里,NVIDIA潜心修炼内功,Ampere安培架构(GeForce RTX 30系列)的强悍表现让许多的质疑者成为了支持者。
今年以世界上第一位女程序员Ada Lovelace为名的新架构正式亮相,属于GeForce RTX 40系列显卡的时代正式到来。先进的TSMC 4N NVIDIA定制工艺,全新的全景光线追踪以及新一代的DLSS 3技术……在游戏画质与流畅度再一次拥有质的飞跃。
GeForce RTX 40系列显卡首发三个型号:GeForce RTX 4090/GeForce RTX 4080 (16GB版本)/GeForce RTX 4080(12GB版本)。今天,我们拿到七彩虹战斧GeForce RTX 4090豪华版显卡,借助它来带您详细了解新一代显卡的具体性能表现。
NVIDIA Ada Lovelace架构分析:
1、内部的架构:GPC规模猛增
七彩虹战斧GeForce RTX 4090豪华版显卡采用的是AD102-300核心,这并不是完整版。完整形态的AD102核心包含12个图形处理集群(GPC),从Ampere的7个猛增至12个,光凭这一点,就能带来很强的性能提升。此外,还包含72个纹理处理簇(TPC),144个流式多处理器(SM),搭配12个32bit的显存接口(共计384bit)。
上图为SM单元,AD102中每个SM单元包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)。还包含16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core,因此共计32个CUDA。当然少不了1个第三代RT Core,4个第四代Tensor Core,4个纹理单元(Texture Units),256KB寄存器堆,以及可根据需求进行配置的128KB L1共享缓存。
2、第三代RT Core:带来全景光线追踪
七彩虹战斧GeForce RTX 4090豪华版显卡从第二代RT Core升级到第三代,从两代架构对比来看,第三代RT Core架构增加了微映射透明度(Opacity Micro-Map,OMM)引擎和微网格置换(Displaced Micro-Mesh,DMM)引擎。除此之外,还对L2缓存上进行了升级,配置98304KB的L2缓存,比Ampere 提高16倍。这些都让光线追踪性能获得巨大收益。
3、着色器执行重排序:提高光追效率
在接近真实场景的实时光线追踪中,多样化的环境变化意味着本应重要的原始处理工作量会越来越少,反而像反色、间接照明、半透明效果的二次折射等计算会占据大量的着色器资源,让着色器忙碌在无意义的二次反射、漫反射等场景中,导致效率降低。如果不加以解决,GPU以有序性常规执行方式会非常低效。
为此,七彩虹战斧GeForce RTX 4090豪华版显卡引入了【着色器执行重排序(Shader Execution Reordering,SER)】功能,能够让着色器更智能的安排每一项工作的重要程度,从而能大大提高渲染的效率。SER可以为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。
4、第四代Tensor Core:AI计算效能倍增
七彩虹战斧GeForce RTX 4090豪华版显卡从第三代Tensor Core升级到第四代,新一代Tensor Core的FP16、BF16、TF32、INT8、INT4性能相对前一代提升两倍以上,实现AI计算性能大幅度提升。
5、全新DLSS 3 : 真正的帧率收割机
DLSS 3绝对是七彩虹战斧GeForce RTX 4090豪华版显卡最亮眼的技术。DLSS 3包括了全新的帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术。
DLSS本质通过深度学习算法将单帧的低分辨率提升成高分辨率,让游戏帧率获得大幅度提升。但这还不够,在DLSS 3上,利用光流加速器与DLSS相结合的办法,构建一个更为立体的分析方式:之前的帧与当下帧,由光流加速器生成光流场、游戏运动矢量和深度等数据,DLSS将新渲染的帧与之前的帧进行比较,并考虑运动矢量与光流场信息,了解场景变化,从而生成一个全新高质量帧。简单的理解,AI生成帧不需要占用太多GPU资源,是由AI计算出来的。
DLSS 3在光流加速器的搭配下实现了脱离GPU渲染重建高分辨率方法,让GPU渲染的部分大幅减少,以两帧为例,DLSS 3会承担起第一帧的3/4的工作和第二帧的所有工作,实际上GPU只需要完成其中的1/8的渲染即可,从而节省了大量的计算资源。
DLSS 3也并非传统意义上的单一技术,事实上它是一个软件与硬件协同的集合。在软件层面,DLSS 3使用AI超分辨率生成,AI生成帧,加入对NVIDIA Reflex支持。在硬件层面,DLSS 3需要在第四代Tensor Core上运行,并利用改进的光流加速器帮助DLSS 3像素级的测量场景,最后云端的NVIDIA超级计算机则夜以继日的寻找提升高质量图像的途径。上述六种软硬件结合,才最终实现了DLSS 3的高质量表现。
目前已经超过35款游戏和应用支持DLSS 3,包括寒霜引擎、Unity 、虚幻引擎4 & 5 等游戏开发引擎,《赛博朋克2077》、《逆水寒》、《微软模拟飞行》、《瘟疫传说:安魂曲》等热门游戏大作,未来支持DLSS 3的游戏会越来越多。
RTX 4090显卡的规格:
GeForce RTX4090显卡用上TSMC 4N NVIDIA定制工艺,由台积电5N改进而来。AD102核心面积没有增加的前提下,晶体管数目爆涨,从283亿个提升至763亿个。流处理器方面,GeForce RTX 4090达到16384个,相比GeForce RTX 3090 Ti提升34%。同时第四代Tensor Core和第三代RT Core的数量,相比GeForce RTX 3090 Ti都有大幅度增涨。
GeForce RTX4090显卡核心Boost频率达到2520MHz,比GeForce RTX 3090 Ti的1860MHz高得多,后续如果经AIC厂商调教,轻松超过2.52G。显存来自美光定制GDDR6X,24GB满配,显存带宽超1TB/s峰值。
功耗方面,GeForce RTX4090与GeForce RTX 3090 Ti保持一致,都是450W,这出乎很多人的意料,这也从侧面证明Ada Lovelace架构GPU能耗比的巨大飞跃。
至于价格上,GeForce RTX 4090官方建议零售价12999元,比GeForce RTX 3090 Ti便宜2000。当然12999只是公版指导价,非公版显卡价格要贵一些。
战斧GeForce RTX 4090豪华版的规格:
▲七彩虹战斧GeForce RTX 4090豪华版的GPU-Z信息
七彩虹战斧GeForce RTX 4090豪华版设定的Boost频率为2565MHz,比公版的2520MHz,高了45MHz。功耗设定450W,峰值功耗则在480W,功耗也保持一致,理论上性能跟公版一致。如果搭配旗舰型号的CPU,推荐1000W或以上电源比较稳妥。
七彩虹战斧GeForce RTX 4090豪华版显卡介绍:
产品的外包装,印有一把战斧,右下角标识着产品型号GEFORCE RTX 4090。
整体采用黑与红的撞色设计,金属外观,经磨砂工艺处理,非常有质感。钻石状三角元素,起到点缀作用,也彰显了力量感。
区别于旧款战斧,战斧豪华版全新的造型,方正硬朗,肌肉感十足。很酷,也很强!
由于性能增强,供电与散热也要强化,GeForce RTX 4090的体积又增加了。七彩虹战斧GeForce RTX 4090豪华版尺寸为长817.5000000000001px,宽度377.5px,厚度为167.75px,跟以前20系列显卡相比,几乎大了一圈。
妥妥要占据三个PCIe插槽,对机箱兼容性要求可不低。
全金属背板设计,尾部同样做了镂空处理,方便空气的对流,利于通风散热。
七彩虹战斧GeForce RTX 4090豪华版显卡采用了利斧散热器,正面设计三个98mm的大风扇,实现更强的风压以及更大的进风量。
战斧散热器内置2根6mm和4根8mm的镀镍热管,大面积液冷均热板和散热鳍片,保证高负载场景下,快速驱散热量,保证显卡性能稳定发挥。
供电接口为新型的16Pin(12+4Pin)PCIe5.0供电接口,12pin为供电口,另外4Pin负责信号传输,单口可以承载600W功耗。
使用ATX3.0标准的电源,只需一根供电线即可,看着比过去3个8Pin口简洁多了。
如果您使用的不是新款ATX3.0电源,没有16Pin供电口,随显卡附赠一条转接线,3个8Pin转16Pin,可与旧款电源兼容。
侧边的隐藏式LOGO RGB信仰灯,通过新款iGame Center软件,可以进行灯光设置。
不同的灯光效果,让机箱内部更多彩。
接口上,提供一个HDMI2.1和三个DP1.4a。其中HDMI2.1接口可支持8K@60Hz视频输出。
顺便提一款有意思的“玩物”,随七彩虹战斧GeForce RTX 4090豪华版显卡一起送测的,还有这款拼奇积木联名的iGame奇趣主机。
这款奇趣主机是由主机、主板、内存、显卡几大部分积木组装而成,喜欢DIY硬件的小伙伴们,用它也能体验一回装机乐趣,或者新手朋友,先自己尝试尝试DIY电脑过程。如果大家对这款积木感兴趣,可以微信小程序搜索“COLORFUL官方旗舰店”购买编辑同款。
新款iGame Center软件:
七彩虹显卡专用的集成控制软件iGame Center同步更新到了最新版本,整个软件进行深度优化,不仅界面更清晰明了,功能也更加丰富。
搭载七彩虹RGB硬件,在这里可以对全局灯光进行控制。有不同灯效模式,也可以对灯光的速度,亮度,方向等进行调节。
除了灯效同步,还能单独对显卡的灯光模式进行调节,可玩性还是挺高的。
灯光控制的另外一栏则是超频控制,在这里可以调整显卡的核心频率,显存频率,电压,温度及功耗等。
在监控日志里,可以控制LCD屏幕的各种显示功能,不过战斧系列并没有配备LCD屏幕。
新款iGame Center软件加入玩家俱乐部,以增加玩家的粘性。
测试平台介绍:
测试平台如上,CPU使用i9-12900K,搭配一块Z690 D5主板,内存则是DDR5-6000高频,16GBx2双通道。
测试GeForce RTX 4090这样的性能猛兽,怎么能少得了一款旗舰级的4K电竞显示器呢?我们测试所使用的是:爱攻PD32M保时捷联名电竞显示器,堪称“旗舰中的旗舰”。
它搭载一块31.5英寸Mini LED背光技术面板,内置3456颗Mini LED背光灯珠,多达1152个独立控光分区;高达1600尼特的峰值亮度,通过DisplayHDR 1400专业认证;97%DCI-P3、99% AdobeRGB、100% sRGB的广色域覆盖,10.7亿色显示,搭配DeltaE<2的专业色准,色彩表现在电竞显示器中属于“天花板”级别,能够更好展出游戏中的光影效果。电竞属性方面,PD32M支持144Hz高刷新率和1ms疾速灰阶响应时间,可提供畅快淋漓的游戏体验。4K超高清分辨率,特效全开,才能不负显卡。
七彩虹战斧GeForce RTX 4090豪华版显卡的峰值功耗在480W,而i9-12900K的满载功耗接近260W,光显卡+CPU这两项功耗值740W,考虑到40%的冗余功耗,以此保证一些高负载情况下正常运行,我们使用了航嘉新款MVP P1200 ATX3.0电源,额定功率1200W,一步到位保证平台的稳定供电。
基准性能测试:
以3DMark作为显卡基准测试软件,测试项目有Fire Strike、Fire Strike Extreme、Fire Strike Ultra(对应DX11,1080P、2K及4K分辨率)。Time Spy 和Time Spy Extreme(对应DX12 2K和4K分辨率)。还有Port Royal光线追踪性能。
▲七彩虹战斧GeForce RTX 4090豪华版显卡 Time Spy得分36384分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡 Time Spy Extreme得分19292分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike得分77359分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike Extreme得分45734分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike Ultra得分24866分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡 Port Royal光追得分25669分。
基准测试方面,战斧GeForce RTX 4090 豪华版对比RTX 3090 Ti,这性能提升幅度可以用“夸张”来形容。Time Spy性能提升68%;Time Spy Extreme性能提升73%;Fire Strike性能提升55%;Fire Strike Extreme性能提升76%;Fire Strike Ultra性能提升82%;而光追性能提升更是达到78%。怎么样?这新卡的性能提升幅度,各位看客老爷们还满意不?
4K光栅化游戏性能测试:
传统光栅化游戏测试分辨率为3840x2160,考虑显卡的定位,不测试2K及1080P分辨率。画质设定均为最高,关闭垂直同步功能,支持DLSS均处于关闭状态,全部测试的游戏由自带Benchmark输出结果。
我们一共测试6款热门的3A大作,在4K分辨率,最高画质设定,不牺牲画质特效的前提下,也不需要DLSS辅助,战斧 GeForce RTX 4090 豪华版显卡均可以非常流畅运行。
像渣优化的《赛博朋克2077》跑出76帧,而显卡杀手《荒野大镖客2》跑出121帧,《古墓丽影 暗影》更是跑出夸张的184帧,要知道这可是4K分辨率啊。毫无夸张地说,4K最高画质在战斧 GeForce RTX 4090 豪华版面前只能算是“入门”的挑战。
对比GeForce RTX 3090 Ti,《赛博朋克2077》、《荒野大镖客2》、《极限竞速:地平线5》、《刺客信条 奥德赛》、《古墓丽影 暗影》、《孤岛惊魂5》分别提升46%、46%、73%、54%、73%、30%,提升幅度还是相当惊人的。
DLSS 3 游戏实测:
我们先来看看战斧 GeForce RTX 4090 豪华版在DLSS 3开启与关闭状态下,游戏画质变化如何?
《瘟疫传说:安魂曲》DLSS 3 OFF VS DLSS 3 NO
《逆水寒》DLSS 3 OFF VS DLSS 3 NO
《Unity引擎》DLSS 3 OFF VS DLSS 3 NO
我们截取部分支持DLSS 3游戏的实景画面,像《瘟疫传说:安魂曲》、《逆水寒》的游戏画面通过对比可以看到,在开启DLSS 3之后,画质并没有折损,反而是得到强化,尤其是光影效果更加真实。
开启DLSS 3之后,游戏帧数的提升相当惊人,瘟疫传说:安魂曲》、《赛博朋克2077》的帧率分别翻了2.35倍、3.27倍。就算特别吃CPU资源的《微软模拟飞行》也翻了2.15倍。
在画质没有损失反而加强的前提下,带来如此巨大的游戏性能提升,对于游戏玩家来说,无疑是幸福的存在。未来有DLSS 3加持下,4K+光追+最高特效,将会顺畅无比。
DLSS 3游戏近期更新:
●《超级人类》(SUPER PEOPLE):抢先体验版将于10月12日13:00发布,支持DLSS 3
●《生死轮回》(Loopmancer)将于10月12日发布更新版,支持DLSS 3
●《逆水寒》“拂云庭“(Justice ‘Fuyun Court’): 全新图形展示将于10月13日发布,支持DLSS 3
●《微软模拟飞行》(Microsoft Flight Simulator):将于10月17日为Xbox Insider计划成员推出测试版,支持DLSS 3
●《瘟疫传说:安魂曲》(A Plague Tale: Requiem):将于10月18日发布,支持DLSS 3
实时光线追踪游戏测试:
RTX光线追踪测试,同为4K分辨率,画质设定均为最高,光追效果设定均为最高档位,不开启DLSS选项,接受最为苛刻的硬件考验。
光追游戏测试部分,就算不开DLSS的情况下,除了《赛博朋克2077》,其他四款游戏,战斧 GeForce RTX 4090 豪华版已经可以超过60帧流畅运行。
像光追效果十分明显的《Control》可以在140帧的超高帧率下,畅玩4K光追。《光明记忆:无限》、《古墓丽影 暗影》均突破100帧。战斧 GeForce RTX 4090 豪华版显卡真正带我们走进4K光追的时代。而对比GeForce RTX 3090 Ti,光追游戏性能提升幅度在70%左右。
创作应用测试:
由于测试时间关系,还有考虑到GeForce RTX 4090刚推出,专业创作应用软件需要去做优化,我们就只测了Blender这款热门的专业三维渲染软件,使用固定的Benchmark进行测试,测试了monster/junkshop/classroom三个场景。
战斧 GeForce RTX 4090 豪华版在monster/junkshop/classroom场景得分为6331、2806、2911分,平均4050分。对比之下,领先GeForce RTX 3090 Ti 幅度达到80%以上,可见在创作领域,战斧 GeForceRTX 4090 豪华版也比GeForce RTX 3090Ti强出一截,帮助创作者节省大量的渲染时间。
功耗与温度测试:
在温度与功耗测试中,使用Furmark软件,对显卡进行10分钟的满载测试,用GPU-Z软件来监控显卡的温度与功耗表现。
在满载10分钟之后,这时GPU的核心温度仅70℃,要知道这可是一张旗舰级显卡,性能怪兽。有这样的温度表现,绝对处于优秀的水平。
功耗的话,平均接近450W,基本跟GeForce RTX 3090 Ti是持平的。不过,峰值功耗更猛一些。如果搭配新款旗舰CPU,比如i9-12900K、i9-13900K,建议至少1000W电源起步吧,850W压力还是挺大的。
总结:
经历了GeForce RTX 30系列显卡性能大跃进,很多人都担心GeForce RTX 40系列显卡无法超越前辈。当测完战斧 GeForce RTX 4090 豪华版后,我们担心显然是多余的。基于Ada Lovelace GPU架构设计AD102-300核心的RTX 4090再次实现性能飞跃,真正将游戏带入4K光追时代。曾几何时,4K游戏遥不可及,到如今的4K+光追最高特效流畅玩耍。或许摆在2-3年前,很多人想都不敢想吧。
这次NVIDIA还带来DLSS 3,这是一项真正的黑技术。在开启DLSS 3之后,宛如打开性能释放的密钥,开启与关闭,性能提升非常非常显著,真正意义上实现从性能的堆砌到质的改变。未来会有越来越多的游戏加入DLSS 3,N卡玩家最幸福的存在。
战斧 GeForce RTX 4090 豪华版的450W功耗,虽说整体功耗不低,但发热控制得不错。并且这个功耗也是频率大幅度提升的结果,由此带来强大的性能提升,我认为是值得的。
最后给大家送上产品的发售信息,七彩虹战斧GeForce RTX 4090豪华版、iGame GeForce RTX 4090 Vulcan OC、iGame GeForce RTX 4090 Neptune OC三款显卡将于10月12日晚9点整在京东、天猫、抖音、快手等电商平台及全国经销零售渠道开售,售价在12999-14999元之间,感兴趣的小伙伴可以关注。