AMD的RDNA 2架构显卡,也就是RX 6000系列是2020年11月推出的,至今已经有一年半的时间,最近下一代的RDNA 3架构最近的消息越来越多,但距离它正式发布应该还有好一段时间,在新显卡到来之前市场需要新产品刺激,NVIDIA此前也对自己的RTX 30系显卡进行了升级,作为回应AMD现在推出了Radeon RX 6950 XT、RX 6750 XT和RX 6650 XT,而本文则是AMD的新旗舰显卡Radeon RX 6950 XT的评测。
其实和此前的Radeon RX 6900 XT、RX 6700 XT和RX 6600 XT这三款显卡相比,RX 6950 XT、RX 6750 XT和RX 6650 XT这三款新卡其实并没有对GPU规格进行更改,依然是7nm的Navi 21、Navi 22和Navi 23,只不过显卡的TBP提高了,GPU能工作在更高的频率,并且这些显卡原本用的是16Gbps的GDDR6显存,现在换了频率更高的18Gbps显存,让新显卡拥有更高的性能。
Radeon RX 6950 XT和RX 6900 XT相比,TBP从原来的300W提升到了335W,Boost频率从2250MHz提升到了2310MHz,游戏频率则从2015MHz提升到了2100MHz,显存等效数据频率从16Gbps提升到了18Gbps,显存带宽从512GB/s增至576GB/s,大家可以把RX 6950 XT看作RX 6900 XT的官方超频版,显卡的建议零售价是8399元,仅比原来的7999元增加了400元。
RDNA 2架构解析:更快频率、更高能耗比、更强性能
RDNA 2架构三大改进点:
· 高频率设计:RDNA 2架构相比RDNA 1架构实现了同功耗下30%的MAX频率提升;· 无限缓存设计:可以消除带宽瓶颈,极大的提升了等效带宽并降低功耗,有助于提升能耗比;· 支持DX12U、DS API:紧随时代潮流,让A卡支持光追等高级API特性。
RDNA 2架构是一个强大的游戏架构,它这次相比RDNA 1代架构主要有三个大改进。首先AMD在RDNA 2上实现了突破性的高频率设计,在拥有高频率的同时维持较好的能耗表现。其次AMD专门为RDNA 2研发了革命性的AMD Infinity Cache无限缓存技术,无限缓存在提供非常可观的等效带宽的同时还更节能,能耗表现更上一层楼。第三个改进点就是支持了DX12 Ultimate的高级特性,包括DXR、DirectStorage等API,让AMD的显卡也加入到支持DX12 Ultimate的大家族中。
改进1:唯快不破,RDNA 2架构主打高频设计
先来看频率改进,RDNA 2实现了突破性的高频率设计,虽然与RDNA都是相同的7nm制程工艺但是进步巨大。通过这张图表我们可以看到,以每个计算单元CU为例RDNA 2架构实现了相同功耗30%的频率提升,而如果是相同的频率则功耗只有RDNA的一半还少一些,也就是能耗比提升50%以上。
改进2:消除带宽瓶颈,引入“Infinity Cache”技术
RDNA 2的成功源自于RDNA 1的研发经验,在RDNA 1代架构上AMD在两组CU单元组成的Dual Compute Unit中添加了L0级缓存,全新设计的L1缓存及减少拥塞的4MB共享L2缓存,让RDNA架构提升了缓存带宽、减少了缓存的延迟及功耗。最终通过256-bit位宽14Gb/s显存速率的GDDR6显存达到了448GB/S的显卡带宽,看起来还是很不错的。
只不过这样的带宽对于RDNA 2来说还不够,AMD发明了全新的无限缓存技术。这项技术的实现多亏了CPU部门的研发经验,AMD解决思路其实就是把原本用于EPYC霄龙服务器处理器上的高密度SRAM专门为GPU加以优化, 并且为其加上AMD在Zen架构上大获成功的“Infinity Fabric”无限总线, 两者合二为一就成为了“Infinity Cache”无限缓存这个新一代带宽利器。
RDNA 2通过“无限缓存”大带宽,低功耗的帮助实现了IPC的提升、同时提高工作频率,完成每个时钟指令的功耗也下降明显。把三项提升综合到一起,就可以让RDNA 2架构在RDNA 1架构的基础上能耗比继续大幅度提升,多达54%。
改进3:紧随时代潮流,全面支持DX12U、DS API
我们再来看RDNA 2架构上第三个改进点,支持更多的高级特性。AMD在RDNA 2上终于全面支持了DirectX 12 Ultimate、DirectStorage API等高级特性,让A卡也可以使用诸如DirectX光线追踪、可变速率着色、网格着色器、采样器反馈等技术。
·光线加速器 Ray Accelerator
实时光线追踪是一个能让游戏画面更真实、提高玩家沉浸感的重要技术。实时光线追踪最大的缺点就是对显卡的计算能力要求极高,传统的CU单元运行实时光线追踪的效率非常低,为了让实时光线追踪的画面更为流畅,AMD在RDNA 2架构的每一个CU计算单元里都放入了一个"Ray Accelerator"光线加速器, CU计算单元越多,RDNA 2架构显卡的实时光线追踪性能就越强大。
"Ray Accelerator"光线加速器是用于处理光线相交计算的专用硬件。与软件方案相比,其相交计算性能可提高10倍。同时,实时光线追踪性能也可以吃到“无限缓存”带来的增益,并且由于RDNA 2覆盖市场的全面性,PC与主机都能享受到实时光线追踪的技术。此外可变速率着色、网格着色器、采样器反馈等特性也得到了支持。
FSR技术的加入
AMD FSR技术是通过超分辨率来达到拉伸画面,再加上锐化,从而达到提高帧数之余又可以保持不错画面质量的目的。这个听起来与AMD自己本身有的FidelityFX CAS有点相似,这也是正常的,因为FSR两者都有利用锐化以及超分辨率拉伸技术。不过两者的最大分别是,FSR是拉伸及锐化游戏内物体的边缘,使得画面整体看上去更加像是高分辨率下的产物。
另外,FSR是逐帧来拉伸画面的,并不像DLSS那样需要参考过去的帧画面、动态矢量预测等要素才可以拉伸。虽然FSR和DLSS并没有用相同的技术,但是就应用这方面来说DLSS是以更加复杂的方式来呈现更多的效果,因此需要GPU有专用硬件才可以运行,而FSR则是弹性稍高,可以更方便地加入到游戏当中,并且可以支持更多的硬件。
大家都知道NVIDIA的DLSS是分成了几个模式的,而AMD FSR也是一样,而且比起前者还多一个,总共有超高质量(Ultra Quality)、质量(Quality)、平衡(Balance)以及性能(Performance)这几个模式。这4个模式相对应的,就是4个不同的拉伸分辨率。以4K(2160P)为例,性能模式的输入分辨率是1080P,平衡模式是1270P,质量是1440P,而超高质量则是1662P。不过,这些分辨率也不是固定的,FSR的输入分辨率会随着显示分辨率而按照比例调整,因此理论上即便是那些神神奇奇的分辨率都可以支持。
技嘉Radeon RX 6950 XT GAMING OC 16G显卡介绍
测试使用的是技嘉Radeon RX 6950 XT GAMING OC 16G显卡,外形设计基本上和RX 6900 XT GAMING OC 16G相近,但用了更大尺寸的散热器,所以整体尺寸明显放大了许多,显卡长度是332mm,高143mm,厚度是57mm,基本上有2.75槽那么厚。
显卡所用的风之力三风扇散热器采用三把100mm大尺寸刀刃式风扇,风扇两两之间旋转方向是不同的,这有助于降低扰流让气流更顺畅,散热器支持智能启停技术,在低负载时风扇停转以降低噪音,此外风扇轴承用的是纳米石墨烯润滑油,可以延长一般油封轴承的风扇寿命,让风扇的寿命水平达到滚珠轴承级别,但风扇噪音要比滚珠轴承低得多,显卡的顶部配有RGB灯,可通过技嘉的灯控软件控制。
显卡背部是覆盖有金属背板的,同时兼顾散热和加固功能,还用了进气格栅设计,延长的散热鳍片可以让风流直接通过,提升散热性能。
拆开散热器后你会发现它上面除了热管之外还有一块很大尺寸的均热板,这均热板是直接接触GPU的,显存则要透过铜片和导热垫才能把热量传到均热板上,显卡前部的供电也收这块均热板照顾,后部供电元件则是由散热鳍片照顾。除了均热板外这散热器还用了6根8mm直径的热管,规格可以说相当豪华了,强劲的散热能力可让GPU和显存在高频情况下稳定工作。
在显示接口方面,显卡提供了2个DisplayPort1.4接口,和2个HDMI2.1接口,满足各种显示设备的使用。挡板可以看到进行了大量 梯形镂空的设计,可以在兼具稳固性的前提下增加废热的排出效率,增加散热效果。
要驱动这款需要用到3个8pin供电口,理论上可以提供450W的电力,默认是绝对够用的,主要是准备给超频情况下显卡功耗增大后有足够的供电冗余。
PCB上除了GPU和显存外,剩余空间基本上都用于布置供电元件,GPU的左右两侧都有供电电路,一共是17相,其中14相给GPU核心供电,3相为显存供电。供电部分的mosFET均是英飞凌的TDA21490,单颗就可提供90A的电流,供电控制方面主要是1颗IR35217来负责。
测试平台与说明
为了避免瓶颈,测试平台使用Core i9-12900K处理器,使用两根16GB的金士顿 FURY Beast DDR5-5200内存,到了Radeon RX 6950 XT这种旗舰级显卡,大多数用户基本都不会考虑平台成本了,直接使用顶级的处理器配最新的DDR5内存。
至于对比对象方面,Radeon RX 6900 XT是肯定不能少的,此外我们还加入了对手同价位RTX 3080 Ti来对比,平台使用Windows 11操作系统,AMD显卡使用Adrenalin 22.10 DCH驱动,而NVIDIA显卡使用GeForce Driver 512.59 Game Ready驱动,全部统一关闭SAM。
用GPU-Z查看得到,技嘉Radeon RX 6950 XT GAMING OC 16G显卡的GPU核心基础频率是1958MHz,游戏频率2116MHz,Boost频率2324MHz, 显卡的频率比公版略微高一些,显卡的功耗限制可以在-10%到+20%之间调节。
3DMark理论性能测试
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Port Royal以及DirectX七个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal以及DirectX是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
RX 6950 XT和RX 6900 XT两者只有频率上的区别,所以性能基本上都是平稳的线性提升,在3DMark的所有测试项目里面,RX 6950 XT基本都领先RX 6900 XT约4%~5%左右。
和对手的RTX 3080 Ti相比的话,基于DX11的Fire Strike项目领先幅度是最大的,接近18%,而基于DX12的Time Spy项目里领先幅度也有10%,而4K级的Time Spy Extreme里领先幅度收窄到5%,而在支持光追的Port Royal测试中NVIDIA显卡优势十分明显,RTX 3080 Ti在这里超出了RX 6950 XT有21%之多,在高压力的光追项目里面RDNA 2架构并没有优势。
实际游戏性能测试
因为AMD Radeon RX 6950 XT这种旗舰显卡的主要目标是在2K、4K分辨率下进行游戏,因此本次的测试重点放在了2K、4K的光追与传统光栅化游戏的测试,所有游戏测试时均开启最高特效(地铁:离去为Ultra模式),并且图形API均选择游戏支持最新的API。现在随着次时代主机的发布,我特意挑选了几款“次时代”游戏进行测试,这些游戏对显卡的要求极高,更能体现显卡在新游戏中的表现。
2K游戏性能测试
传统光栅化游戏性能测试
在传统光栅化游戏的测试中,比拼的就是显卡的硬实力了。根据游戏的不同RX 6950 XT领先RX 6900 XT的幅度在2%~7%之间。在大多数项目中 都领先同价位的RTX 3080 Ti显卡,在11个项目里面有9个是领先的,还有1个打平,只有1个是落后的,领先幅度最大的是《刺客信条:英灵殿》达到了28%。
光追游戏性能测试
光追游戏方面就得看游戏用了多少光追特效以及对显卡的光追性能需求有多高了,部分游戏里面RX 6950 XT和RX 6900 XT相比甚至没有提升,比如像《孤岛惊魂6》这种对光追的性能需求就比较低,所以RX 6950 XT能在这游戏里面领先RTX 3080 Ti,有同样情况的还有《尘埃5》,而到了《古墓丽影:暗影》这种RX 6950 XT已经轻微落后于RTX 3080 Ti了,余下几款对光追要求极高的RX 6950 XT与RTX 3080 Ti差距还蛮明显的。
4K游戏性能测试
传统光栅化游戏性能测试
把分辨率提升到4K后,RX 6950 XT与RX 6900 XT相比大概领先4%~6%左右,只有《无主之地3》两者性能几乎相同。和对手的RTX 3080 Ti相比的话,在《孤岛惊魂6》、《刺客信条:英灵殿》里面的优势还蛮明显的,其他游戏RX 6950 XT基本上都和RTX 3080 Ti打平。
光追游戏性能测试
4K光追游戏的测试结果和2K的差不多,在光追性能要求不高的游戏里面RX 6950 XT的表现优于RTX 3080 Ti,但到了光追压力较大的游戏里面RTX 3080 Ti就能反超RX 6950 XT,RDNA 2架构的光追性能其实也就NVIDIA上一代图灵架构差不多,和最新安培架构还是有一定差距。
功耗测试
通过我们手中的PCAT套件,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Time Spy Extreme压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
负载时技嘉Radeon RX 6950 XT GAMING OC 16G的平均功耗是387.2W,而峰值功耗460.5W,显卡的功耗并不低,而且峰值功耗确实有点高,待机时的平均功耗则是19.5W,搭配电源的话,考虑到CPU等平台其他部件的功耗,建议850W的电源起步。
温度测试
在温度测试直接裸机,测试环境温度约为24℃,待机温度是开机以后记录5分钟,满载温度则是在运行3DMark Time Spy Extreme压力测试中取得,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线:
技嘉Radeon RX 6950 XT GAMING OC 16G具有风扇待机停转的功能,所以待机状态下全靠被动散热。经过5分钟的待机测试,显卡的待机温度在32到34℃之间,仍然属于很清凉的范畴,热点温度则 在36到38℃之间,也不是很热。
满载状态下,该卡GPU最高温度仅仅才只有71℃,这对于RX 6950 XT这种旗舰卡来说温度是相当低的了,说明这卡配的散热器是散热性能真的非常强,当然热点温度就略微有些高了,最高有96℃,推测是VRM供电部分的瞬时温度,热点负载时的平均温度大概88℃左右。
透过GPU-Z来看,技嘉Radeon RX 6950 XT GAMING OC 16G在待机时风扇是会停转的,让它在待机状态下完全无任何噪音,当GPU有高于一定程度负载时风扇就会启动,满载状态下,风扇 最终会稳定在1900RPM附近,噪音其实并不算太高,在可以接受范围。
运行3DMark Time Spy Extreme测试时GPU核显频率波动比较厉害,最高频率则是2412MHz,频率曲线如下图所示:
超频测试
显卡的TBP最高能拉到350W左右,频率能通过AMD的显卡控制面板直接调节,显卡的Boost频率最高能到2800MHz,但此时显存频率基本上不能动,把Boost频率降到2750MHz后,显存的灯效数据频率就能从18Gbps拉到19Gbps,这时的性能提升在最高的,3DMark Time Spy显卡测试成绩从21086升至22230,性能提升了5%左右,感觉如果把功耗限制放得再宽点性能应该能进一步提升。
总结
这RX 6950 XT其实没啥好说的,就是RX 6900 XT的官方超频版,但由于搭载了规格更高的18Gbps的GDDR5显存,显存频率达到了以前极难达到的水平,加上显卡的TBP进一步放宽,GPU的频率也比RX 6900 XT要高出不少,整体性能提升在5%左右,价格也没比RX 6900 XT高出多少,从7999元涨至8399元,涨幅在一个合理的范围内。
和它的竞争对手相比,显卡在绝对传统性能上相比同价位的RTX 3080 Ti要高出不少,但光追性能表现还是有些差距,两者各有优势,AMD现在也有和对手DLSS对标的FSR技术,此前NVIDIA DLSS的技术优势不再,RX 6950 XT较RTX 3080 Ti最大的优势在显存容量上,RTX 3080 Ti的12GB显存在某些场合还是不够的,RX 6950 XT的16GB显存就好多了。
此外RTX 3090的游戏性能在绝大部分情况下都和RTX 3080 Ti差不多的,大家也可以把上面RTX 3080 Ti的测试大致当成RTX 3090来看,RX 6950 XT的售价只有RTX 3090的70%左右,选择RX 6900 XT的话就相当于省下30%的钱买一张综合性能和RTX 3090接近的显卡,是不是感觉划算多了?
本次测试用的技嘉Radeon RX 6950 XT GAMING OC 16G在散热方面的表现相当不错,三把100mm风扇提供了强劲的风力,均热板+6根8mm热管的组合在旗舰显卡上也是相当少见的配置,强大的风之力三散热器把RX 6950 XT的GPU压到大概只有70℃左右,相当清凉,不过这显卡的功耗确实有些高,平均380W,峰值能到460W,选购RX 6950 XT的朋友真得准备个850W以上的电源才足够,显卡的价格和官方建议零售价一致是8399元,目前已经在京东上架。