有个有趣的问题经常被提起:至强E5和E7 CPU比同代高端i7贵数倍乃至几十倍,但单核主频却相对持平甚至落后,难道多余的钱都用来增加内核了吗?E5凭什么这么贵?更进一步的问题是如果有钱任性,像Apple的Mac Pro一样搭一个E5单路workstation划得来吗(Refurbished Mac Pro 3.7GHz Quad-Core Intel Xeon E5)?
i7和E5型号众多,为了检验该命题的真伪,我们选取型号较老的Broadwell架构三款同代至强cpu和酷睿CPU来进行比较。它们是
i7 5775R Intel® Core™ i7-5775R Processor (6M Cache, up to 3.80 GHz) Product SpecificationsXeon E5-2667 Intel® Xeon® Processor E5-2667 v4 (25M Cache, 3.20 GHz) Product SpecificationsXeon E5-4669 Intel® Xeon® Processor E5-4669 v4 (55M Cache, 2.20 GHz) Product Specifications先来个全家福:
这里推荐Intel的官网:Intel® Product Specifications,在它上面可以很方便的选出各种CPU型号进行比较。我们先来看一下他们的基本情况和价格:
它们都是14nm工艺。但i7的价格只有E5-2667价格的1/6,只有E5-4669价格的1/20。我们再看一下他们的基本配置情况:
这页有很多需要重点关注的内容:核心数从4,一路上升到22。主频i7-5775和E5-2667很接近,在3.2GHz左右,但E5-4669就降低到了2.2GHz。这是为了在TDP相对E5-2667不变的情况下塞入更多的核心和cache而做的牺牲。Cache数目相差巨大,从i7的6MB上升到55MB,几乎上升10倍。
同样的,这一页亮点也很多。内存i7只支持双通道,最大32GB,且不支持ECC内存。而E5则支持高达1.54TB内存,支持4通道和ECC内存。
其他方面E5没有内置GPU,i7不支持TXT等功能。感兴趣的同学可以详见我做好的比较表:Intel® Product Specification Comparison
性能比较
我用Cinebench简单地对i7-5775和E5-2667做了Benchmark,单核性能比较:
多核性能:
CineBench是很有说服力的一套CPU和显卡测试系统。这里用的是最新的是R15版。相比R11.5版本的最多16个核心来说,R15版本最多能够支持256个逻辑核心,此外新版本还加强了着色器、抗锯齿、阴影、灯光以及反射模糊等的考察,对CPU性能的检测更加准确,也比较符合我们日常的游戏和工作行为。
GeekBeach的数据如下是,单核:
多核:
性能分析
从Cinebench结果来看E5-2667的单核性能因为频率的略微差距而落后与i7,而多出了1倍的内核也带来了不到1倍多核性能的提高,多出的Cache完全没有发挥作用。而E5-4669的单核性能更是远远落在了后面。Geekbench的结果略有不同但也没有根本区别。这些数据和6倍到20倍的价格形成鲜明反差,那么买E5的人是不是人傻钱多呢?
E5的优点
i7系列对于一般用户使用场景进行了优化。因为多数应用对应多线程没有优化,太多线程往往没有什么意义,还不如睿频高一些。
而至强系列,尤其是E5和E7系列,一般用于服务器和高级工作站,内核数最多的HCC版的架构如下:
内核数次之的MCC和最少的LCC架构:
它们除了内核数不同外,都对服务器场景做了特殊优化:
在TDP极限下,尽量加入更多核而不是提高单核性能。因为服务器往往运行服务器操作系统,任务也多为多任务而优化,甚至大部分都安装虚拟机,IaaS可以让每个核都各尽其用。对于Big data等系统,24个2.2G的核比4个3.3G的核更加重要。对ECC内存和RDIMM的支持。服务器对于关键性数据错误极其敏感,尤其是金融领域。ECC和RDIMM对运算速度没有帮助,但对数据安全提高很大。对超大内存的支持。32G的内存也许对于一般用户足够用了,但对于服务器却远远不够。现在内存数据库发展很快,至强1.5TB的内存变得十分必要。极大的LLC(Last Level Cache)。进一步减少了对内存带宽的压力,提高了效能。多达40个Lane的PCIe。服务器往往需要外插GPU扩展浮点计算能力,尤其是机器学习大行其道的今天,每个CPU后面往往要插两个N卡或者Xeon Phi的PCIe卡。16 lane * 2 = 32个lane是必备需求,再加上高速的网口也需要连接在CPU后面,40个lane有时都捉襟见肘。更多内存通道。Xeon支持4通道,双路支持8通道。极大的扩展了内存带宽,对高吞吐的服务器十分重要。更多了RAS特性。现在很多关键性领域,如银行等,要求可靠性达到n个9,RAS中的热插拔内存和CPU使之成为可能。内存花样繁多的可靠性扩展功能,更有Mirror特性,可以组成类似RAID的内存庸余阵列,极大地提高了内存的可靠性。极大的扩展性。E5的两条QPI/UPI总线,可以搭建双路甚至四路服务器(2跳);E7的三条QPI/UPI可以搭建只要1跳的4路服务器和最大2跳的八路服务器,极大的扩展了服务器的最大内核数和内存容量:那么为什么Mac Pro选择E5呢?我们来看一下它的组成框架图:
Apple正是看中了E5的四路ECC DIMM的支持,以及对40 Lane的PCIe的支持,可以让它同时插入两个16 lane的AMD GPU和8 lane的PEX,占满了所有PCIe的通道。同时Apple聪明的选择了核心少而主频高的E5 SKU,就像例子中的E5-2667,而没有选择E5-4669,既保证了单线程应用的需要,又让工作站的整体性能十分彪悍。
结论
E5/E7贵有贵的理由,它对于服务器和高级工作站来说十分合适。对于普通用户来讲,就显得不那么必要了,要知道,别看E5 CPU贵,支持它的主板和ECC内存也很贵,比较新的一般便宜的5万RMB,不是一般消费者可以企及的。实在是看着至强眼馋,也可以选择E3过过瘾。