自从RTX 40系列显卡发布以来,英伟达和老黄就被喷惨了,主要原因是RTX 40系列中的大多数型号,尤其是最受期待的RTX 4060系列,相比上一代,各项规格参数均有较大幅度缩水,弄得怨声载道。
大家吐槽最多的就是英伟达在“挤牙膏”,貌似这几年英伟达在消费级显卡领域的技术没有多大进步,——那么事实是不是这样呢?
对于这个问题,如果我们只把注意力放在两三年时间内,的确感知不强,很难得出客观结论,但是如果我们对比的时间线和产品拉长一点,结果就完全不同了。本文将拿英伟达在11年前发布的GeForce GTX 680与最新的GeForce RTX 4080进行一次“跨十年”的对比。
请注意:这场PK的主要目的并不是对比输赢,输赢没有悬念,并且预计GeForce GTX 680已经无法以最低门槛30 FPS的性能流畅运行时下的主流游戏了,主要目的是为了回顾、检验英伟达这十年来的技术演进之路,算是管中窥豹。
一、参数对比
GeForce GTX 680发布于2012年5月22日,采用GK104 GPU,基于Kepler架构,台积电28纳米工艺,拥有1536个着色器,128个纹理单元,32个光栅单元,L2级缓存为0.5MB。
标准运行频率为1006 MHz,最高运行频率为1058 MHz,搭载2GB GDDR5显存,显存速度为6Gbps,显存位宽为256 bit,显存带宽为192.3GB/s,FP32性能为3.250TFLOPS,功耗为195W,建议零售价为499美元。
GeForce RTX 4080 16GB版发布于2022年9月20日,采用AD103 GPU(图二),基于Ada Lovelace架构,台积电5纳米工艺,拥有9728个CUDA内核,76个光线追踪单元,112个光栅单元,304个纹理单元,304个张量内核,76个多单元流处理器,L2级缓存为64MB。
标准运行频率为2205 MHz,最高运行频率为2505 MHz,搭载16GB GDDR6X显存,显存位宽为256 bit,显存速度为22.4 Gbps,显存带宽为716.8GB/s,FP32浮点性能为48.74 TFLOPS,功耗为320W,建议零售价为1199美元。
平心而论,放在十年前,GeForce GTX 680的规格并不低,即使是后期的GeForce GTX 960,它的位宽也只有128bit,定价499美元,放在现在也是中端显卡的价格了。
二、测试平台配置
主要配置如下:
处理器为英特尔Core i9-13900K,主板为华硕ROG Strix Z790-E Gaming,内存是芝奇Trident Z5 RGB DDR5 6000MHz,硬盘为两块三星970 EVO M.2 2280 1TB,操作系统是Windows 11。
三、游戏实测
下面将分别测试六款游戏,均采用1080P低画质模式,以下图片中左边代表GeForce GTX 680平台,右边代表GeForce RTX 4080平台。
第一款游戏是《赛博朋克2077》。
GeForce GTX 680平台的平均帧速为16 FPS,远没有达到流畅运行的最低门槛,最低瞬时帧速为12 FPS,帧时间为63.6ms,CPU使用率为11%,功耗为58W,温度为59度,内存使用量为13.1GB,GPU使用率为99%,显存使用量为2.0GB,功耗为126W,温度为65度。
GeForce RTX 4080平台的平均帧速为149 FPS,最低瞬时帧速为117 FPS,帧时间为5.7ms,CPU使用率为52%,功耗为121W,温度为62度,内存使用量为9.9GB,GPU使用率为56%,显存使用量为4.5GB,功耗为178W,温度为52度。
在这款游戏中,GeForce GTX 680平台的GPU使用率为99%,显存使用量为2.0GB,基本上是处于火力全开,满载运行的状态。
但是,GeForce GTX 680平台的CPU使用率只有11%,GeForce RTX 4080平台达到了52%,是它的近五倍。由于性能较差,GeForce GTX 680平台所使用的内存比对手多近3GB,GeForce RTX 4080平台的GPU使用率仅有56%,还没有到60%,显存使用量高出2.5GB,显存容量更大的优势很明显。
在这种情况下,GeForce RTX 4080平台的平均帧速将近是GeForce GTX 680平台的9.3倍,帧时间只有GeForce GTX 680平台的9%,功耗比GeForce GTX 680高近50W,但温度还低13度。
第二款游戏是《霍格沃茨之遗》。
GeForce GTX 680平台的平均帧速为25 FPS,离流畅运行的最低门槛差一点点,最低瞬时帧速为20 FPS,帧时间为34.4ms,CPU使用率为3%,功耗为39W,温度为50度,内存使用量为22.3GB,GPU使用率为100%,显存使用量为1.9GB,功耗为142W,温度为67度。
GeForce RTX 4080平台的平均帧速为207 FPS,最低瞬时帧速为167 FPS,帧时间为5.0ms,CPU使用率为24%,功耗为77W,温度为53度,内存使用量为19.9GB,GPU使用率为62%,显存使用量为4.7GB,功耗为213W,温度为53度。
在这款游戏中,GeForce GTX 680平台的GPU使用率为100%,显存使用量近2GB,基本上还是处于满载运行状态。
在CPU使用率方面,GeForce RTX 4080平台是GeForce GTX 680平台的8倍,内存使用量低2GB左右,因为它不需要使用那么多内存,显存使用量高出2.8GB,GPU使用率只有62%,刚过60%,还有40%的性能保留。
在平均帧速方面,GeForce RTX 4080平台将近是GeForce GTX 680平台的8.3倍,帧时间只有GeForce GTX 680平台的15%,功耗比GeForce GTX 680高近70W,温度低14度。
第三款游戏是《巫师3》。
GeForce GTX 680平台的平均帧速为59 FPS,终于超过了流畅运行的最低门槛,最低瞬时帧速为49 FPS,帧时间为16.5ms,CPU使用率为4%,功耗为43W,温度为43度,内存使用量为11.2GB,GPU使用率为99%,显存使用量为1.9GB,功耗为162W,温度为67度。
GeForce RTX 4080平台的平均帧速为457 FPS,最低瞬时帧速为257 FPS,帧时间为2.5ms,CPU使用率为28%,功耗为94W,温度为56度,内存使用量为12.3GB,GPU使用率为63%,显存使用量为2.6GB,功耗为254W,温度为55度。
在这款游戏中,GeForce GTX 680仍然是满载运行,GPU和显存都耗尽了。在CPU使用率方面,GeForce RTX 4080平台是GeForce GTX 680平台的7倍,内存使用量高近1GB,显存使用量高0.7GB,GPU使用率只有63%。
在平均帧速方面,GeForce RTX 4080平台将近是GeForce GTX 680平台的9.3倍,帧时间只有GeForce GTX 680平台的15%,功耗比GeForce GTX 680高近90W,温度低12度。
第四款游戏是《微软飞行模拟器》。
GeForce GTX 680平台的平均帧速为40 FPS,也超过了流畅运行的最低门槛,最低瞬时帧速为35 FPS,帧时间为25.0ms,CPU使用率为3%,功耗为40W,温度为45度,内存使用量为11.6GB,GPU使用率为99%,显存使用量为2.0GB,功耗为157W,温度为70度。
GeForce RTX 4080平台的平均帧速为193 FPS,最低瞬时帧速为157 FPS,帧时间为4.9ms,CPU使用率为10%,功耗为62W,温度为50度,内存使用量为10.3GB,GPU使用率为52%,显存使用量为3.2GB,功耗为179W,温度为52度。
在这款游戏中,GeForce GTX 680仍然是满载运行,在CPU使用率方面,GeForce RTX 4080平台是GeForce GTX 680平台的3倍,内存使用量低1.3GB,显存使用量高1.2GB,GPU使用率只有52%,还将近有一半的性能保留。
在平均帧速方面,GeForce RTX 4080平台将近是GeForce GTX 680平台的4.8倍,帧时间只有GeForce GTX 680平台的20%,功耗比GeForce GTX 680高近20W,温度低18度。
第五款游戏是《荒野大镖客救赎2》。
GeForce GTX 680平台的平均帧速为23 FPS,最低瞬时帧速为9 FPS,帧时间为44.0ms,CPU使用率为3%,功耗为44W,温度为44度,内存使用量为13.4GB,GPU使用率为99%,显存使用量为2.0GB,功耗为100W,温度为62度。
GeForce RTX 4080平台的平均帧速为184 FPS,最低瞬时帧速为127 FPS,帧时间为5.2ms,CPU使用率为42%,功耗为97W,温度为58度,内存使用量为12.6GB,GPU使用率为61%,显存使用量为3.5GB,功耗为180W,温度为49度。
在这款游戏中,GeForce GTX 680仍然是满载运行,在CPU使用率方面,GeForce RTX 4080平台是GeForce GTX 680平台的14倍,内存使用量低近1GB,显存使用量高1.5GB,GPU使用率只有61%。
在平均帧速方面,GeForce RTX 4080平台的平均帧速将近是GeForce GTX 680平台的8倍,帧时间只有GeForce GTX 680平台的12%,功耗比GeForce GTX 680高近80W,温度低13度。
第六款游戏是《地平线零之曙光》。
GeForce GTX 680平台的平均帧速为31 FPS,最低瞬时帧速为21 FPS,帧时间为31.6ms,CPU使用率为11%,功耗为51W,温度为47度,内存使用量为13.7GB,GPU使用率为99%,显存使用量为2.0GB,功耗为114W,温度为62度。
GeForce RTX 4080平台的平均帧速为286 FPS,最低瞬时帧速为199 FPS,帧时间为3.2ms,CPU使用率为41%,功耗为98W,温度为57度,内存使用量为12.4GB,GPU使用率为74%,显存使用量为5.4GB,功耗为184W,温度为50度。
在这款游戏中,GeForce GTX 680仍然是满载运行,在CPU使用率方面,GeForce RTX 4080平台是GeForce GTX 680平台的3.7倍,内存使用量低1.3GB,显存使用量高3.4GB,但GPU使用率比前几款更高,达到了74%,性能保留部分只有30%左右。
在平均帧速方面,GeForce RTX 4080平台的平均帧速将近是GeForce GTX 680平台的9.2倍,帧时间只有GeForce GTX 680平台的10%,功耗比GeForce GTX 680高近70W,温度低12度。
四、对比结论
对比结果很明显,GeForce RTX 4080平台在GPU性能还有30%到40%保留的情况下,平均帧速可以达到GeForce GTX 680平台的9倍左右,帧时间只有GeForce GTX 680平台的12%左右,显卡温度普遍低10度以上。
请注意:因为两个平台两款显卡的GPU使用率不同,CPU使用率也不同,所以上述结论是针对整个“平台”(主机)而言,这个结论和数据并不能直接和两款显卡的绝对性能对比划等号,只能作为大致参考。
整体来说,英伟达这十年在消费级显卡领域的技术积累和进步还是非常明显,非常大的,是值得尊重肯定的。