截止目前,NVIDIA RTX 30系显卡大部分已经和玩家见面,从9月的发布会开始,时间也已经横跨了整个2020年四季度,本次为大家带来的是12月发布的第一款显卡RTX 3060 Ti的非公版iGame GeForce RTX 3060 Ti Ultra W OC显卡首测。
纵观整个RTX 30系家族,不同型号之间的定位依旧明确:RTX 3090定位内容创作者,超大显存加上接近完整的核心,为专业软件提供更快速的预览及渲染时间;RTX 3080定位旗舰级游戏显卡,其强悍的游戏性能几乎是上一代RTX 2080的2倍,但售价则与RTX 2080相同;RTX 3070则依旧主打中高端游戏市场,比肩RTX 2080 Ti的性能加上更实惠的价格,适合大部分喜欢3A大作的游戏玩家。
iGame GeForce RTX 3060 Ti Ultra系列
本次解禁的RTX 3060 Ti则比较不按常理出牌,首先“60 Ti”这个型号自常规系列的GTX 760 Ti之后就没有出现过(16系显卡除外),可以说近两年的甜品显卡“Ti”这个后缀非常罕见,其次如果出现Ti作为后缀的情况,按照以往的惯例也应该是先发布旗舰产品,如GeForce RTX 2080 Ti。
由于本次公版与非公的解禁时间相同,我们同步为大家带来了公版RTX 3060 Ti与iGame GeForce RTX 3060 Ti Ultra W OC的首测,在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读:
超越RTX 2080 SUPER的性能表现,RTX 2060的价格以“初晴”和复古流行“蒸汽波”风格带来不一样的外观设计一键超频,高于公版的1770MHz总的来说iGame GeForce RTX 3060 Ti Ultra W OC继承并加强了公版卡的性能,并且在外观方面以“初晴”和复古流行“蒸汽波”风格承载懵懂的爱情为主题,打造全新的Ultra系列,整体给人感觉非常舒服和治愈,同时黑白双色的款式搭配也被赋予了不同的意义。
iGame GeForce RTX 3060 Ti Ultra系列
另外在性能表现方面,iGame GeForce RTX 3060 Ti Ultra W OC打破了甜品级显卡的原有表现,不但在2K分辨率下可以做到更高帧率的运行,甚至在4K分辨率下的部分游戏也有不错的表现。超高的性价比加上强劲的性能表现,让原本入门级的显卡有了更高端的定位。
七彩虹京东自营旗舰店:点击进入
01 iGame GeForce RTX 3060 Ti Ultra外观
首先还是先来看外观,我们本次评测的iGame GeForce RTX 3060 Ti Ultra OC共有两个版本,黑色与白色初晴限定版,由于之前的评测介绍过黑色版本,此次我们重点来看一下这款白色的出清限定版。
iGame GeForce RTX 3060 Ti Ultra系列
在上一次的黑色版本中,我们提到了蒸汽波风格,蒸汽波的艺术风格是一种诞生于本世纪10年代初互联网的亚流派,在音乐中的主要表现为慢放、循环、风格化与故意的低保真处理,呈现出复古、梦幻与迷惘的节奏。
蒸汽波风格
而在现代的艺术创作中,大量的蒸汽波元素被应用在海报设计和潮玩产品中,其典型的元素就是带有古希腊色彩的雕塑或廊柱,同时画面色彩以粉色和蓝色为主,搭配椰树、橘子汽水、波点、拼贴等元素。
但如果将蒸汽波简单理解为拼接艺术也并不完全准确,它是几种艺术风格的糅合,画面呈现出来的只是一种表现形式,更深层的意义在于人们潜意识的投射。
iGame RTX 3070 Ultra OC首测 时间错置的蒸汽波
iGame GeForce RTX 3060 Ti Ultra W OC
而我们本次要讲的这款iGame GeForce RTX 3060 Ti Ultra W OC将原本显卡黑色底改为了白色,粉色蓝色白色一下又勾勒出了不一样的意境。
爱琴海的日落
白色的纯洁加上粉蓝两种具有代表性的色彩,让人不禁联想到爱情,“和最爱的人一起,去希腊圣托里尼岛看一次爱琴海的日落”,我想这也是每一对情侣能想到最浪漫的事。
哈莉·奎茵
另外笔者突然发现DC漫画中的小丑女,哈莉·奎茵也正是粉蓝白的色系,这种搭配可能也是身为反派却如此招人喜欢的原因之一吧。
iGame GeForce RTX 3060 Ti Ultra W OC
iGame GeForce RTX 3060 Ti Ultra W OC 风扇特写
说回正题,iGame GeForce RTX 3060 Ti Ultra W OC整体的外观配色无需再说了,显卡正面采用了一小两大的散热设计,两边为13叶边缘折角“捕风手”风扇,可将气旋压入散热器内实现风压及进风量的进一步提升。
iGame GeForce RTX 3060 Ti Ultra W OC背板展示
背板设计上iGame GeForce RTX 3060 Ti Ultra W OC吸收潮流服饰中的设计元素,将正面导流罩部分的logo条带延伸至背板,并与iGame以及RTX的logo形成透视效果。另外在白色版中的logo条带更像是“朕知道了”那卷故宫胶带的缠绕体现,将拼接的设计元素发挥到了极致。
iGame GeForce RTX 3060 Ti Ultra W OC
内部做工上,iGame GeForce RTX 3060 Ti Ultra W OC使用了“回流焊”工艺,2*6mm与2*8mm共四根复合热管与散热鳍片毫无缝隙形成一体,充分优化了散热效能,紧贴散热底座。
iGame GeForce RTX 3060 Ti Ultra W OC 视频输出接口
视频输出接口上,iGame GeForce RTX 3060 Ti Ultra W OC采用DP 1.4a*3+HDMI 2.1的4接口设计,另外新的HDMI 2.1接口可支持单线8K的视频输出。在接口上方为一键超频按钮,默认是与公版相同的1665MHz,按下后基频可达到1770MHz,在后面的跑分测试中我们也将按照超频成绩与默频进行对比。
iGame GeForce RTX 3060 Ti Ultra W OC 供电接口
在供电接口上,iGame GeForce RTX 3060 Ti Ultra W OC采用了与上一代相同的8+8pin供电,而且由于RTX 3060 Ti的自身功耗较小,实测满载功耗仅为200W左右,对于想换新显卡又不想换电源的用户非常友好,推荐的电源为650W及以上。
02 NVIDIA Ampere架构下的RTX 3060 Ti
iGame GeForce RTX 3060 Ti Ultra OC采用了NVIDIA Ampere架构,我们首先来看一下RTX 3060 Ti的提升。
第一代RTX架构 Turing下的2060 SUPER
第二代RTX架构 Ampere下的RTX 3060 Ti
相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060 Ti中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060 Ti的着色器性能达到16.2 TFLOPS单精度性能,而Turing为7.2 TFLOPS。
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到31.6 RT TFLOPS,而Turing为21.7 RT TFLOPS。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达129.6 Tensor TFLOPS,而Turing为57.4 Tensor TFLOPS。
RTX 3060 Ti采用GA104核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3060 Ti中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6显存。
我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
RTX 3060 Ti共有4864个CUDA,其实它有2432个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了4864这个惊人的数字。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
光追工作原理示意
在此次的NVIDIA Ampere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的请求,交给RT Core来处理,它将进行两种测试,分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。
而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。
RT Core的变化
在Turing的RT Core中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。
运动模糊渲染原理
第二代RT Core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。
稀疏深度学习
Tensor Core可以看作是GeForce RTX GPU上的AI大脑。可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。
在本次的NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。
首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。
与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 3DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥iGame GeForce RTX 3060 Ti Ultra W OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,RTX 3060 Ti目前的核心代号在软件上还未知,不过三星8nm是肯定的了,芯片面积未知,拥有4864个CUDA,iGame GeForce RTX 3060 Ti Ultra OC的默频与公版相同为1410-1665MHz,按下一键超频按钮后为1410-1770MHz。采用8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元虽然软件显示为80和405,但显然纹理单元的数据有些错误。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,由于频率的提升iGame GeForce RTX 3060 Ti Ultra W OC相比公版的分数有所提升,另外和公版RTX 2080 SUPER比提升较大,在FS中提升4%,FSE中提升6%,FSU中提升7%,整体来看在各项成绩中均领先RTX 2080 SUPER。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,iGame GeForce RTX 3060 Ti Ultra W OC领先RTX 2080 SUPER更多,在TS中领先6%,在TSE成绩中领先13%。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,iGame GeForce RTX 3060 Ti Ultra W OC的测试结果相比RTX 2080 SUPER提升约为5%。
在理论测试中,iGame GeForce RTX 3060 Ti Ultra W OC相比公版有小幅提升,而相对于RTX 2080 SUPER的提升则更明显。
04 游戏性能测试
在游戏性能测试中,我们选择了《古墓丽影:暗影》、《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《古墓丽影:暗影》游戏测试
《古墓丽影:暗影》游戏测试
由于本次的参测显卡比较多,而古墓丽影分为标准测试和光追DLSS效果的测试,故分为两张表格进行对比,共2组6测。第一组为预设最高画质下,RTX OFF/DLSS OFF;第二组为预设最高画质下,RTX 超高/DLSS ON。
得益于iGame在频率方面的提升,相比公版RTX 3060 Ti的帧数有虽然没有明显提升,但与RTX 3070的差距更小了。
《德军总部新血脉》游戏测试
《德军总部新血脉》的分数也是几经波折,在多次更新驱动后成绩终于正确,并且由于自带两个benchmark,所以我们的数据取跑分均值。iGame GeForce RTX 3060 Ti Ultra W OC领先公版成绩2-3帧,不过从分数对比中感觉跑分仍然存在问题,RTX 3080并没有与后面梯队的显卡拉开。
《刺客信条:奥德赛》游戏测试
接下来是《刺客信条:奥德赛》,其中iGame GeForce RTX 3060 Ti Ultra W OC与公版相比几乎持平,在同级别显卡中,众生平等不是白叫的。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,iGame GeForce RTX 3060 Ti Ultra W OC比RTX 2080在1080P分辨率下分数高4%;2K分辨率下高16%;4K分辨率下高20%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。
《边境》游戏测试
《边境》同样是一款来自柳叶刀工作室的国产3A大作,具体发售日期不明,目前仅提供了benchmark跑分软件。同样的目前跑分软件不支持关闭光追选项,所以在测试时我们选择“RTX 最高/DLSS 质量”下进行。
05 温度与功耗测试
在温度功耗测试方面,室温24℃,我们并没有采用全封闭式的机箱,而是采用测试平台的方法,这样做可以最大限度的保证显卡除了自身散热外将风道等外因减小到最低。
功耗测试(点击查看大图)
功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。作为一款甜品级显卡iGame GeForce RTX 3060 Ti Ultra W OC的功耗要小得多,在峰值情况下整体平均在200W之间,与公版几乎相同。
温度对比
温度方面,本次的iGame GeForce RTX 3060 Ti Ultra W OC温度相对目前的30系显卡有所降低,同时要比公版RTX 3060 Ti的73℃低11℃,尽管频率有很大提升,但温度更低了,足以见得散热效果出众。
06 部分游戏光追效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
第二组对比来自最新的《魔兽世界9.0》,同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
第三组对比为《控制》游戏,这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
07 软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
它戳我脸!
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
08 黑色迷惘复古 白色初晴后雨
首先来说RTX 3060 Ti这款卡的性能方面,通过测试不难发现RTX 3060 Ti的性能还略微高于上一代准旗舰显卡RTX 2080 SUPER,但后者的售价为5000多元。本代的甜品卡超越上一代准旗舰的现象再次出现了。
iGame GeForce RTX 3060 Ti Ultra W OC
而这其中的区别不仅仅是价格,全新的NVIDIA Ampere架构采用了第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同程度加强,还拥有更高的能耗比。
iGame GeForce RTX 3060 Ti Ultra OC系列不同的配色也给人完全不同的设计感,黑色迷惘复古,白色初晴后雨,玩家可以根据自己的心情和喜好来选择购买。
iGame GeForce RTX 3060 Ti Ultra OC
Ultra系列白色版本个人认为更加好看,白色的纯洁加上粉蓝两种具有代表性的色彩,让人不禁联想到爱情。
另外从游戏方面来说,这款甜品卡同样有着非常恐怖的性能,完全可以满足在2K分辨率下的高帧率游戏体验,甚至大部分游戏在4K分辨率下也可以保障60帧的流畅运行。
iGame GeForce RTX 3060 Ti Ultra系列
在以往的型号中70代表着中高端,而在30系中RTX 3070一如既往地中高端,而作为甜品的RTX 3060 Ti一改入门级的表现,甚至能与4K一战,并且在价格方面依旧很诱人。一张有着上一代准旗舰的性能,又与上一代入门级价格相同的卡,谁能不爱呢?