前言:IMFT的3D2 TLC
其实早就拿到这颗INTEL 545S 256GB M.2 SSD了,但是最近一直忙于自己的工作,被弄到焦头烂额,所以拖延了这个测试。
当时去要求送测这颗SSD,更多的想法还是想看看第一颗INTEL 3D NAND 64层堆叠的TLC的写入有哪些性能上面的改善,因为光从参数来看,并看不出什么特别的优势。
那么根据INTEL的命名规则,545S使用的3D2 TLC即为IMFT 3D TLC第二代64层堆叠,IMFT在垂直方向上采用了传统浮栅技术(floating gate technology)。3D2 TLC的Die具有64个有效层,以及用于伪字线和源极漏极选择栅极的附加层。闪存单元使用垂直沟道环绕栅极结构。CMOS解码器和读出放大器位于NAND闪存阵列下面,可大大节省芯片面积。3D2 TLC的Die大小256Gb=32GB,Die尺寸为59mm 2,TLC位密度为4.34Gb / mm 2
而600P使用的3D1 TLC则为IMFT 3D TLC第一代32层堆叠。3D1 TLC的Die具有32个有效层,3D1 TLC的Die大小384Gb=48GB,Die尺寸为168.5mm2,TLC位密度为2.28Gb / mm2。
从技术层面和成本考量来说,16NM TLC的单DIE大小是128Gb=16GB,而3D TLC 第一代32层堆叠的单DIE是384Gb=48GB,而3D TLC第二代64层堆叠的单DIE是256Gb=32GB。从IMFT的PPT来看,3D1 TLC 比16NM 2D TLC每GB成本降低30%,而3D2 TLC又比3D1 TLC的每GB成本降低30%。
相对于东芝的BICS3和三星的3D V-NAND的64 Layers的3D TLC而言,IMFT 3D2 TLC在单位面积内的容量做到了最大化4.34Gb / mm2,但是目前从INTEL 545S的M.2型号来看,最大只有512GB,而且只有2颗NAND,说明IMFT封装3D2 TLC的时候目前只做到了8Die的封装,所以目前单颗NAND最大做到了256GB容量。看来虽然Die面积在64Layer的3D TLC中做到了最小的59mm2,但是在大容量封装中也不是具有绝对优势的。
当然这些3D NAND的前言说完了,我们还是最关心使用这个NAND制造的SSD的效能到底如何?
第一章 外观、拆解以及IC解析
INTEL 545S 256GB M.2的外观
官标参数其实相对于早期的540S还是没有明显的提升,虽然是M2 SSD,但是同为SATA 6G的非NVME产品的速度基本也就这样了。
最大化持续读:550 MB/S
最大化持续写:500 MB/S
最大化随机读:75K IOPS
最大化随机写:85K IOPS
寿命来说终身写入量和3D1 TLC的600P保持一致,144TBW,160W小时的平均无故障时间,五年保修。
从差异化而言,545S区别于600P和540S的最大特性是加入了端对端的数据保护,而INTEL的消费级SMI主控产品依然按照惯例关闭了远程安全擦除功能。
去标拆解后,可以很明显的看出所有的IC元件都在SSD的正面,而反面是裸板。
正面PCB赫然分布着一颗主控,一颗缓存和两颗NAND。
主控SMI P6W549 其实就是SMI2259。不过是INTEL定制版主控而已,这颗SoC内置了32位的RSIC CPU,SATA6G接口,支持4通道共32CE的NAND。
从SMI2259的资料来看,和SMI2258的区别有几点:
1、2259是BGA332针脚封装,2258是BGA323针脚封装
2、2259加入了端对端保护
3、2259支持ONFI 4.0的NAND,而2258仅支持ONFI 3.0
4、从发展趋势来看,2259应该是SMI针对IMFT新一代的3D2 TLC以及未来的3D3 TLC的支持会更加完善。
SKhynix H5TC2G63GFR是SKhynix出品的DDR3L 1600 256MB缓存
29F01T2ANCTH2是INTEL 3D2 TLC,使用了64层堆叠,单颗容量128GB,因为3D2单Die就是32GB而已,所以这颗NAND应该是4Die封装。
第二章 测试
第一节 测试平台
主板
华擎Z370M ITX/AC处理器
INTEL I7 8700KDRAM
芝奇 幻光戟 DDR4 3200 C14 8GBX2图形
EVGA GTX1060 6GB SC电源
台达FLEX 400W金牌机壳
ZS-A4M散热器
猫头鹰L9I系统盘
INTEL DC S3500 800G操作系统
Microsoft Windows 10 PRO X64 1703
第二节 初测
CDI的SMART检测属性,依然还不完整。
对于TLC盘来说,大家最关心的还是不同大小的数据块下的读写衰减情况,以及空盘和接近满盘下的性能差距
AS SSD BENCHMARK 空盘下1/3/5/10GB数据块下的测试
AS SSD BENCHMARK 83%满盘下1/3/5/10GB数据块下的测试
CDM测试选用1GB 4GB 16GB 32GB数据块大小在空盘下进行测试
CDM测试选用1GB 4GB 16GB 32GB数据块大小在83%满盘下进行测试
在两个测试中可以发现,空盘和83%满盘下的测试几乎没有什么差异化存在,而不同数据块大小影响的只是持续的写入性能,但是衰减不大,AS SSD BENCHMARK的1G~10G数据块下的持续写入衰减在34%,而CDM在1G~32GB数据块测试下的持续写入衰减在17%左右,这已经好于大多数的TLC盘的表现了。
用HDTACH去印证全盘读写效能的话,可以发现,在爆掉545S的SLC Cache之后,持续写入从400MB/S以上跌落在272MB/S附近,而持续读取则一直保持平稳的466MB/S的速度。
使用HDTUNE的测试得出的结论和HDTACH基本一致
将我们的测试勾选为4GB的数据快大小快捷行程来测试写入的话,可以得出该盘的SLC Cache在2GB~2.2GB左右。
下面将要进行的是最大带宽测试和离散度测试,测试之前的预处理手法是:
* 清洗:安全擦除即SECURE EARSE
* 预热:使用IOMETER在128K持续写入双倍SSD容量
第三节 最大带宽测试
最大带宽测试其实是我对官标的一个验证测试,每个SSD都有自己的性能评估标准,而我们用类似的评估手法去评测性能,判定是否达到官方标称的性能参数。
使用IOMETER对128K进行持续读写,对4K进行随机读写,深度均为QD1-128,每个深度一分钟,统计平均值,列入下表。
545S M2 256GB 4K 随机写入最大带宽是86163 IOPS
4K随机写入QD1-128的进程中,速度稳步上升,到QD16止步于86K IOPS,看起来似乎远不如参与对比的NVME SSD。
545S M2 256GB 4K 读取写入最大带宽是78095 IOPS
4K随机写入QD1-128的进程中,速度稳步上升到QD128,而QD1-16的4K读取效能是完全压制INTEL 600P 512GB的,直到QD16之后才被600P 512GB反超。
545S M2 256GB 128K 持续写入最大带宽是495MB/S
545S M2 256GB 128K 持续读取最大带宽是542MB/S
然后我们再次拿出官标的参数来看下,
最大化持续读:550 MB/S
最大化持续写:500 MB/S
最大化随机读:75K IOPS
最大化随机写:85K IOPS
持续读写略偏低,随机读写实际比官标略高一点,基本可以说,官标达标。
第四节 离散度测试
4K QD32 随机写入4000秒
当4K随机写入效能从80K IOPS跌下这一段是Cache的轨迹,随后便是真实的高压下的4K随机写入效能,平均数值在4000IOPS附近,最低下潜在1000IOPS附近,平均延迟密集分布在10MS附近,而最高的平均延迟在40MS附近。
4K QD32 随机读取4000秒
4K随机读取测试倒是如意料之中的雷打不动一条直线,稳定在77K IOPS,平均延迟0.42MS依然雷打不动。
128K QD32 持续写入4000秒
128KB的持续写入相对来说我觉得比较平稳,虽然有一些主动GC的锯齿浮动存在,但是依旧算比较平稳,从520MB/S的Cache轨迹掉落在250~270MB/S附近,平均延迟集中在14-17MS之间,相对比较稳定。
128K QD32 持续写读取4000秒
128K持续读取倒是意料中的的曲线,520MB/S的平均读取速度和7.5MS的平均延迟,非常的稳健。
由于考虑到商用级也有INTEL PRO 5450这个系列同主控闪存不同固件的方案存在,所以我很好奇的进行了一次INTEL企业级应用环境测试,从我内心来说是想看看是否会压到 0 IOPS,虽然这么做对于一块消费级SSD过于苛刻。
第五节 INTEL企业级应用环境测试
企业级SSD寿命计算器 http://estimator.intel.com/ssdendurance/是INTEL根据在思科甲骨文等大公司投放企业级SSD在企业级应用的测试数据回收后建立的企业级模板,其中涉及到很多的企业级应用是非常真实可靠的。换句话说INTEL在产品服务和产品使用信息调研上投入的资金是其他任何一家公司无法相比的!我用INTEL的企业级应用的设定去模拟其运行的IOMETER模板来进行性能的探索。我在INTEL的库里挑选了几个典型代表意义的企业级应用模型建立IOMETER模板运行15分钟进行对比。
前端WEB服务器
前端WEB服务器指负责生成页面视图的服务器,一般需要能应付前面响应的大量IO,相对而言后端负责业务处理的服务器,相对地需要大量的运算CPU和内存,对IO响应要求不高,如果直接让后端也处理IO效能不好,所以前端负责缓冲着请求,然后向后端再请求服务,后端处理完响应后再响应返回,分开处理。
负载模式为:随机模式4K QD32,读80%写20%,运行15分钟
针对此类4K数据块大深度下的随机高读少写负载任务而言,
速度上545S M2 256GB控制在5K-65K IOPS之间,平均在15K IOPS附近,
平均延迟上545S M2 256GB控制在0.5-8.2毫秒之间,平均在2.8毫秒附近。
平心而论,这个数据勉强可以看得过去。
数据仓库服务器
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
负载模式:随机模式 8K QD128,读60%写40%,运行15分钟。
针对此类8K数据块大深度下的随机混合读写负载任务而言,
速度上545S M2 256GB控制在2K-33K IOPS之间,平均在4.8K IOPS附近
平均延迟上545S M2 256GB控制在5-120毫秒之间,平均在33毫秒附近
8K的深度下没有压到0 IOPS已经让我有点意外了,但是此刻的平均延迟已经很高了,这个盘已经不能较好得满足这个应用需求了。
流媒体播放服务器
流媒体播放服务器很容易理解,主要架构包括:内容管理,服务器支持,访问控制,举个例子:乐视、爱奇艺都有类似的开发项目。
负载方式:持续模式64K QD128,读90%写10%,测试15分钟
针对此类64K大数据块大深度下的持续高读负载任务而言:
速度上545S M2 256GB控制在0.4K-4.6K IOPS之间,平均在1.7K IOPS附近
平均延迟上545S M2 256GB控制在30-370毫秒之间,平均在70毫秒附近。
这个测试是压到最低的IOPS是400,依然没有压到0,平均延迟最高达到370毫秒,很明显此刻这个盘已经快被压榨到极限了。
从这三个测试的结果来看,545S 256GB M2在4K 8K 64K的企业级混合读写负载中表现说不上好,甚至可以说已经无法满足应用,主控资源几乎被压榨干净了,但是依然没有0 IOPS的出现,放在民用消费级来使用的话,理论上是不会有什么问题的。这也是在企业级苛刻条件下测试的结论然后放宽到民用范畴的一种主观反馈。
结论
其实我挺希望INTEL将自己的主控应用于消费级的,而不是使用SMI主控来应付消费级,准确来说INTEL 730停产之后,INTEL消费级和商用级再无硬货,这句话本身没有错误的。
而SMI主控是否一无是处呢?其实也不然,SMI2262 NVME主控还是非常强悍的效能,接近MV1093的表现力,目测INTEL很快会在自己的消费级上使用取代600P的位置。
针对SMI2259的545S而言,这块盘的感觉就是持续写入效能比普通的TLC要更高一些,而且更加稳健一些,在大数据块的测试中,除了持续写入之外的写入测试都还是很稳定的,满盘和空盘的区别很小,说明固件对3D2 TLC的写入衰减优化还是比较到位的,相对于一般的2D TLC盘来说,这个盘给人的感觉还是从始至终的稳定!
那么价格的话,INTEL给出的建议零售价格是99美金,630RMB附近。但是前面我们说了,3D2 TLC的问世理论上应该带来是NAND的降价而不是涨价,但是有一个很现实的问题存在就是从2D产线转到3D产线所需要布局的资金量是巨大的,INTEL不可能不在NAND的价格高峰期尽可能的收回转线的投资成本,而且按照INTEL所赋予的5年只换不修免邮的RMA政策,这个盘的价格也就不可能低到500元以下的大众期许价格了。
那么对于初衷是为了降低NAND成本而生的3D NAND而言,零售商也卖了很多,消费者也购买了很多,但是零售商一直在喊叫采购价太高赚不到钱,而消费者一直在呼喊零售价太高占不到便宜,而其实最终的胜者是谁,上面一张图就不言而喻了!