电脑装配网

A57与A53,Exynos 5433 vs Exynos

 人阅读 | 作者xiaolin | 时间:2023-08-03 06:36

三星虽然已经爆出会在下一代旗舰手机上使用Exynos 7系列处理器,但是就目前已经发表的机器而言,5433依旧是三星最强的处理器,该款处理器是首款使用了ARM的64位A57架构的手机处理器,那么其性能又和前代产品有何差别呢?

在分析处理器之前,我们还是首先看看Note 4的各种衍生型号吧,总计达到了15款(惊):

于是依据上表,S805处理器的Note 4就有共计9个版本,每款的基带射频设定都有些不同,Exynos版本则是光基带都有好多种,型号为N910U的使用的英特尔的基带,韩版的N910S/K/L使用的三星自己的基带,剩下的N910C和N910H都使用爱立信的基带,但是N910H不支持LTE网络。

晕了吗?目前在售的Exynos版本绝大多数采用了爱立信的基带,型号为N910C和N910H,分别对应南美市场和中、东欧、非洲、中东以及部分亚洲国家,这款基带最早在一年半之前就发布了,一直默默无闻到今天Note 4上被广泛采用,不知道都以为爱立信不出基带了,而更有意思的是对应3G型号Note 4使用了M7450基带,而在以往,3G网络的Note手机是使用英特尔基带的。

但是不管如何,最后这15款不同的Note 4最后都归结到消费者是选择S805处理器还是Exynos 5433处理器上(当然在大陆正规渠道售卖的国行Note 4只有S805处理器供选择),其余的部分不会有太大的差别(国行是3000毫安时电池双卡双待,而单卡版的电池则会有3220毫安时),而接下来的测试全部基于型号为N910C的Note 4,运行的固件版本为KTU84P.N910CXXU1ANJ8。

好了,接下来进入正文,让我们来看看Exynos 5433这颗处理器吧,这款处理器是首款使用了ARM的A53/A57架构和T760 GPU的移动处理器,尽管三星没有特地强调这点,但是5433基本就是这样没跑了,不过在5433之后,三星又发布了新的Exynos 7系列处理器,而5433从编号上看,依旧是属于5系列的产品。

在5433刚出来的时候,笔者就很怀疑5433到底会不会解除对64位运算能力的封印,因为在分析过N910C的内核之后,我们发现内核对待这款处理器的态度跟对待A7/A15处理器的态度没什么区别,整个软件也基本还是32位的,而现在部分地区的Exynos处理器版本的Note 4也获得了Android 5.0的系统升级,但是实测升级到5.0系统之后,5433依旧还是运行在32位下的,看来三星将5433定位为Exynos 5系列处理器自有道理,今后5433获得64位处理能力的希望也比较渺茫了,是需要照顾买了S805处理器版本的消费者的感情吗?

5433的GPU继续使用了6核心设计,也就是说,这个核心数量和已经推出的5420、5422和5430一模一样,在获得Galaxy Alpha之后,我们发现5430处理器搭配了825MHz的内存,于是5430的内存带宽就从我们广为认知的17GB/s缩减到了13.2GB/s。

从另一个侧面来说,5433和5430的区别其实是非常小的——因为二者使用了几乎相同的辅助单元IP设计,使用了相同的ISP、硬件解码器和编码器、各种界面和总线架构。

805和5433之前一个很大的区别就是显示控制器了,因为Note 4的屏幕规格达到了1440×2560并且需要支持32bpp和60fps,单条4通道的MIPI DSI 协议的控制器已经不够用了,于是高通使用了双DSI的设计,如下图。

S805加入了两条DSI接口,每条接口具有4通道,将屏幕的分为两块720×2560来进行驱动,Exynos处理器因为具有MIC(移动图像压缩)技术,所以仅需要用到一条DSI接口,这虽然省下了带宽,但是坏处就是需要在显示驱动之中加入一个用来解压缩的单元以保证整个显示模块的正常运转。

不过话说回来,既然Note 4使用的三星自产的AMOLED显示模组,所以爱怎么定制就是三星自己的事情了,使用带宽压缩之后,最多能够节省下150mW的显示功率,平均下来也能接近100mW,这在需要频繁刷新屏幕的时候对于功耗的节省还是比较可观的,至于静态画面显示的省电则交给面板自刷新技术了。

自从5430开始,三星就给自己的处理器用上了20nm的工艺,不过相对于28nm工艺,要说20nm工艺能够节省多少电量其实很难以计算,毕竟每家的工艺不同,举个例子来说,三星的28nm HKMG的功耗和台积电的28nm HPM的功耗就不一样。

从上方表格能够看出,在改进工艺之后,A15核心在各频率的平均功耗下降值达到了24%,而在最大频率的功耗下降则达到了29%,A7核心平均的功耗下降甚至达到了40%,A7在最大频率下的功耗下降甚至有56%之多,看来三星在核心布置和面积上进行了优化,而分析从5410到5420到5422这三代处理器也不难发现即便在使用了类似的大小核设计之后,核心面积却是不相同的。

但是回头看高通,805在飚上2.7GHz的高频率的时候,功耗为965mW,而在300MHz的时候功耗则为57mW,也从一个侧面说明了HPM的效率优势(当然这个功耗没有把二级缓存的功耗算进去),805达到最高频率所需的电压也比5430和5433更低。

回到20nm上,20nm相对于28nm最大的优势还是能够节省下CPU的面积,在使用20nm之后,A7核心的面积下降了45%,而A15核心的面积更是下降了夸张的64%,各自的辅助群的面积下降也在15%左右。

但是GPU方面,5430的GPU面积却比5420要大一些,这是因为5430大幅增加了缓存的面积。不过对于三星来说,20nm终究只是一个跳板,5430和5433也成为了三星旗下为数不多的使用20nm制成的处理器,在2015年,三星还是专注于开发14nm的FinFET工艺,而根据三星公布的消息,14nm的高端处理器早在2014年11月中旬就已经投产了,而到了2015年我们就可以玩到正式使用14nm工艺处理器的手机了(也许就是Galaxy S6上面的Exynos 7420喔)。

总的来说,三星的20nm芯片尽管在数值上领先于28nm,但是三星的20nm依旧优化不足,成熟度是不如台积电的28nm工艺的。

A53架构是ARMv8大棋的第一步,作为A7的继任者,A53具有同样的超低功耗、小芯片面年纪和相对过得去的性能,只不过最大的改变就是将A7的架构延伸至64位,在低端Android的市场上,A7(包括现在的A53)基本就是一家独大,但是Exynos的高端处理器用上A7和A53最大的意义还是使用大小核的构造来平衡整体的功耗。

和A7相同,A53使用了顺序执行的设计,这也使得A53在ARMv8阵营之中成为了一朵奇葩,师出同门的A57架构用巨大的芯片面积和功耗换来了高性能,而A53的目标则是在小身材和低功耗的前提下尽量榨取顺序执行的性能,这也迫使ARM必须将顺序执行的设计尽可能的优化。

将A53剥皮抽筋,我们能够发现A53和A7的执行特性是相同的,与处理单元相配的L1数据缓存和指令缓存各自可以从8KB到64KB不等,L2缓存则会有更多选择——从128KB到2MB不等,至于5433处理器,则使用了512KB的L2缓存,而A53部分的CPU通过一条很宽的界面预知下昂连,使得每个核心能够依序访问L2缓存。

同时,ARM也在A53上优化了其的双发射设计,使得处理器本身的双发射性能获得提升,在A7处理器上,双发射中的slot-0(1号发射槽)是全功能的,而slot-1(2号发射槽)则只能够传送下分支或者整数数据,而在A53处理器上,slot-1增加了发送载入/存储指令和FP/NEON指令的能力,这样使得slot-1和slot-0在功能上是相同的,这也就是说只要ARM还坚持双发射的设计,A53的性能应当只被CPU核心数量所限制了。

ARM还为A53加入了新的条件和非直接预测单元,前者为一个6Kbit的Gshare预测器,后者则具备256条目并且还具备历史记录功能,由此提升了A53的分支预测性能,增加了命中率并且降低了误预测所造成的时间浪费。

在功耗方面,A53还具有可选的切换电源模式的功能,新加入的滞留模组能够控制每个CPU核心的功耗。

在性能方面,ARM宣称A53在相同频率下和A9的西能耐相同,在考虑到A9的性能和A53的核心面积的时候,ARM所做的一切还是相当令人印象深刻的。

但是针对5433处理器进行性能测试的时候,我们看着测试结果的时候真的很难想到5433的A53核心是具有512KB的L2缓存的,因为延迟曲线升高的更早更快,这个表现和那些256KB L2缓存的设计无异。

看完了延迟我们再来看看读取带宽,5433的成绩再次让我们觉得十分有意思,说实话获得这个成绩我们不知道是因为ARM改进了双发射设计,还是三星神秘优化的结果,或者是二者兼有,从成绩尚来看,5433的A53核心在读取带宽的成绩上接近了5430的A7的性能的两倍,世界神奇的地方还是不少的。

最后,对于A53的双发射瓶颈还能再啰嗦两句,ARM在A53上已经尽可能的对双发射设计做出了优化了,也许是双发射的设计已经到了顶,ARM最新发布的CPU架构之中并没有对A53进行更新,而是发布了A57的继任者A72,而对于A53的继任者,我们还是满满的期待着的。

在性能方面,目前5433的Galaxy Note 4在升级Android 5.0之后并没有开启AArch64,也就是说不管如何Note 4的5433是运行在32位下的,也就是说ARMv8的性能应当是没有完全发挥的,用于跑分的测试结果也是使用32位的软件。

将5430的A7进行对比,总体来说SPEC CPU2000的跑分之中,A53的成绩比A7高了30%左右,正好5430和5433的小核心的运行频率是相同的,所以对于我们做对比还是相当方便。

在上方的成绩表之中,ART的提升是最大的,该测试使用图像识别/自然网络工作以测试CPU的浮点性能,而得分下降的VPR和TWOLF测试则应当是因为之前提到的L2缓存性能原因。

在GeekBench 3之中,ARMv8得益于新的加密指令,使得AES和SHA 性能获得了空前的提升,若是抛开这两项,总体的提升就看上去“正常”了许多,但依旧让人印象深刻,平均的得分提升在49%左右。我们还注意到单线程的BZip压缩和解压测试的成绩提升则不那么亮眼,但是到了多线程成绩上,提升则是巨大的。

浮点测试之中,A53相对于A7再次表现出了巨大的提升,其中多线程的提升尤为明显。

对小核心进行功耗测试的时候,我们需要手动地关闭大核心,以确保在进行测试的时候不会将大核心唤醒,而导致测试不准。

从测试结果不难看出,A53的功耗比A7更大,不过随着线程数的增加,单线程功耗的上升幅度却是减小的——从99到75到66毫瓦,但是就总体而言,四核心A53相对于同样频率四核心A7的功耗增加则是不容忽视的,而就目前的大小核设计而言,将工作任务平均分配到每个核心上面其实是不太好的——这强迫每个核心脱离各自独立的电源控制而运行在相同的频率下,比如在待机时需要唤醒,本来仅需要一个核心就能完成的事情会导致四个核心同时唤醒,这对于功耗的影响还是无法忽略的。

在四核心全开运行1.3GHz(也就是5430和5433的小核心最大频率)的时候,A53核心的功耗比A7的功耗高了122%,而结合上方的频率-功耗折线图我们也能发现在频率超过1GHz之后,小核心的功耗迅速上扬,而5433和5430在小核心的性能/功耗比上,5433反而更低。

不过只看频率和功耗也是不够客观的,因为同制程CPU的耗电量其实还和芯片面积有很大关系,而且A53在A7的基础上加入了不少新的组件,而当5430和5433进行对比的时候,我们发现后者的CPU核心的面积是前者的1.75倍,而Cluster的面积则是1.38倍。

尽管单位功耗的性能降低了,但是说实话ARM的A53依旧是值得尊敬的,毕竟性能提升绝对是好事情,这不仅对于大小核来说是个好事,对于只使用A53核心的处理器来说,只要提升频率和增加核心数量就能获得媲美曾经的高端旗舰手机的性能(比如最近很火的MT6752),剩下的问题就是随着频率的增高和内存的升级,A53还能否在今后的竞争之中继续保持强势了。

至于A57,这自然就是ARM发布的A15的接班人了,但是A57在A15的基础上获得了许多的进化和延续,ARMv8指令集使得A57相对于A15有着更强的单线程性能和更高的效率,同时保留了A15的优点,最终结果自然就是A57虽然不是一个全新的跨越,但至少更新的功能和优化是非常有看头的。

A57毫无疑问是基于乱序执行的设计,相对于英伟达的丹佛来说,A57则显得更为“传统”,简单点来说,A57就是为了在A15的基础上提升性能而出现的,对于能耗比方面ARM希望A57相比较A15在将功耗提高20%的基础上获得25%~50%的性能提升,而这样子算下来单位功耗的性能是能够有提升的,当然前提是性能的提升能够比功耗的提升更多。

对于A57而言,不确定因素就是制程了,因为A57是可以用28nm工艺进行生产的,而三星为了进一步优化或者说展现自己的技术实力(?),选择了使用20nm来生产Exynos 5433处理器,更先进的制程自然能够减小CPU面积,堆核心自然也更得心应手,并且从理论上来说更先进的制程对于省电也是有利的,不过今后使用A57的可能也不止三星一家,这也就是说A57的具体表现也只能是“师父领进门修行在个人”了,并且从总体来看,ARM也在努力提升自己处理器的IPC(Instruction per Clock,单位频率指令数),更高的IPC也允许生产厂家适当降低处理器主频,也就意味着可以适度降低电压和功耗。

A57相对于A15有着无数的小改进,L1缓存被从A15的32KB拓展到48KB,结合度也从双路升级到了3路,这自然是为了提升性能做出的改动,但是也不排除ARMv8更加庞大的指令集使得ARM不得不升级。同时用于存储旧分支并且帮助预测未来分支的分支目标缓存也升级到了2K~4K,至于数据方面,L1数据缓存则保留32KB不变。

L2缓存则是制造商根据自己需要可以进行定制的,大小从512KB到2MB不等,为16位的set-associative组成结构,每个A57核心在L2缓存上面都有自己的界面,所以说在界面层级上不存在共享带宽的问题。

同时,ARM在A57上还进行了指令派送和执行的优化,首先,乱序执行的出口增大了,虽然ARM没有公布具体增大到了多少,但是据说其可以同时处理128条指令,注册表也为AArch64改进了兼容性,现在每个4K分段可以被划为128条32位或者64条64位进行处理,使得在切换到64位之后对应数据包更小,以避免把空间浪费在不必要的地方。

至于管线本身,整数和浮点单元也都获得了性能提升和64位兼容性,同样,ARM没有公布具体技术细节,不过就目前而知的,整数的数据通道既有32位也有64位,如此尽管增加了复杂度,但是也避免了仅保留64位通道时,32位数据通过前需要进行转换的电力消耗。

浮点/NEON单元也从64位提升到了128位,在FP单元能够被完全喂饱的前提下能够获得双倍的NEON性能,但是ARM并没有为其配备多个数据通道,ARM称他们在其他方面进行了优化,以控制整体功耗。A57还支持可选的加密加速单元,该单元能够提升AES和SHA1/SHA2-256的性能。

最后,载入/存储单元的提升,A57之中数据可以绕过非明确的存储,而这能够带来5%的性能提升,另外的独立预测器的加入也能够通过防止A57在进行预测存储的时候进行过度预测以提高乱序执行性能。

L2缓存的内存延迟上,5430和5433没有什么区别,但是带宽的稳定度方面,5433则比5430更好,至于内存延迟方面,这也许是三星故意这么设定的,而带宽表现的提升应该是来源于A57本身相对于A15的提升。

ARM在内存性能上向来名声一般,但是图表不一定能够代表实际体验,SoC和内存控制器之间的通信也是不可忽略的,ARM的做法和苹果和英伟达不同,ARM使用了独立的读取和写入数据接口,在Cluster层级上,ARM用两个128位的界面(一个读取一个写入)将SoC的内存控制器和CCI(缓存连贯互联)的交叉架构,5430和5433的CCI的工作频率位DRAM的一半,也就是412.5MHz,折算下来的单方向物理带宽位6.6GB/s。

不过说实话,今天进行测试的这种方法对于ARM是不利的,因为这样测量出来的只是单向的带宽,而实际上最大能够达到的带宽往往能有测试值的两倍。实际上,同时执行读取和写入测试(当然是在两个CPU上以多线程的形式进行操作)时,带宽达到了内存控制器的理论峰值13.2GB/s,更有意思的是,ARM看起来在L2缓存上也进行了同样的设定,所以5430的A15的L2缓存带宽可以达到25GB/s,5433的A57则能够达到27.5GB/s.

至于为什么ARM要这么设计,我们不得而知,也许是因为功耗和延迟的原因,但总的来说,跑分数据是绝对不能完全代表实际使用体验的,A57这么看来也就是A15很自然的发展的下一步而已,甚至指令管线都没有太多不同,只不过通过AArch64来更好地喂饱这些他们罢了,ARM和它的伙伴们可能也希望使用20nm工艺甚至16/14nm工艺进一步压榨A57的性能,不过就目前的情况看来,A15的功耗已经相当感人了,而A57用更高的功耗来换取性能到底划不划算,还有待时间检验。

在看到SPEC的得分的时候,不难发现A57对A15的性能提升远远没有A53对A7的性能提升那么多,平均下来能有个25%,而考虑到最大主频的区别(5430的A15最大主频是1.8GHz,5433的A57最大主频是1.9GHz),同频的性能提升可能只有18%。

GeekBench的整数得分结果也相同,当然是忽略加密部分的得分的前提下,总体下来你性能提升有31%,同频率的话性能提升就是29%了。

浮点部分,总体提升在21%左右。

在测功耗的时候,因为5433的主频更高,所以分开两次测试,一次使用1.9GHz,另一次使用1.8GHz。

在功耗上二者的区别则有点惊人了,其中5430相对更低的功耗非常引人瞩目,在以往,我们测试的A15(5410和麒麟920)功耗都远在每核心1.5W以上,看来5430使用r3 A15和20nm确实很大程度地降低了A15核心的功耗,甚至可以和高通的Krait持平,三星这一年来搞A15的努力也算没有白费,5430的效率甚至达到了5420的两倍。

不过今天A57才是主角,还是说它吧,A57的功耗相当不好看,就单核心功耗来看,A57的功耗甚至有A15的两倍之多,这可是相当令人担心的,在四核心全开飚1.9GHz的时候,CPU的功耗甚至超过了7W,由此带来的发热自然会导致降频。

至于芯片面积方面,5433的大核心总体下来比5430的大核心增大了4%。

但是和小核心相反,5433的大核心的性能/功耗比比5430的更高,这看起来似乎不太科学,不过BaseMark OS II的测试是使用XML进行的,使得各个核心能够以更接近真实的方式自由控制各自的功耗和性能。

ARM宣称A53和A57能够带来更好更成熟的功耗以及频率控制,不过目前我们手上能够进行比对的也就这三星的两台机器,不过就以上的测试而言,A57确实在效率上胜过了A15。

当把5430和5433当做一个整体来看的时候,我们再进行性能/功耗比值测试,情况就有那么点不一样了,5433的成绩有点不理想,在同时使用A53和A57进行这个性能测试的时候,成绩还不如光使用A53来得漂亮,甚至还不如光用A57来进行这个测试,这应当是由于工作负担频繁地在大小核心之间切换所导致的。

至于5433为什么会有这样的表现,我们还是不确定,也许是因为跑分软件本身或者是数据什么的导致CCI工作负担过重,也许加上ARM前段时间发布的那个CCI-500能够解决问题,虽然我们的结果不能代表一切,但是要说实际使用跟测试结果完全没有重合,那也是不显示的事情。

另外换用网页测试,在这之前,熟悉三星的都应该知道三星在安装了Chrome浏览器之后会导致网页性能下降,所以我们的网页测试全部使用三星自带有神油的浏览器,而在效率测试结果之中,5430再次战胜了5433,尽管前者的优势只有4%,但那也是优势,不过说来倒也情有可原,毕竟5430是三星的第六代使用A15的处理器,而A57在三星手里也仅仅发展了第二代(算上他们的GH7服务器处理器的话),当然我们很希望在后续的发展之中三星能够对其进行优化,或者干脆来个大的更新换代,用最近新发布的A72代替A57。

在手机这个产品线上,使用Exynos 5433的Note 4绝对是新生代的第一“机”,在目前Android手机市场上,A53和A57是最强的处理器架构,性能方面对高通的805也有相当大的优势,如果三星能给Note 4的5433开放AArch64,那么5433在CPU方面的性能优势将更为明显,不过5433的弊端也是很突出的,5433在发挥全部性能的时候功耗相当高,虽然性能有了,但是效率却难以得到保障,ARM说他们将会在将来进一步对这方面进行提升,我们还是翘首以待吧。


文章标签:

本文链接:『转载请注明出处』