当前位置: 绝缘栅 >> 绝缘栅资源 >> 真的比TLC还烂吗看QLC颗粒能否终结S
NAND颗粒制成的SSD,目前已经逐渐在取代HDD,成为PC存储的首选。不过,NANDSSD虽然在性能、稳定性上表现出了比HDD更好的态势,但是其容量较小、成本和价格较高的弱点一直没有得到很好的改善,尤其是在NAND颗粒受制于存储原理无法进一步缩小工艺尺寸、需要3D堆叠技术来制造更大容量的产品之后,这一点变得尤为突出。
在这种情况下,如何进一步提高NAND颗粒的容量呢?业界终于拿出了QLC方案。QLC方案究竟是什么,目前已经出现在市场上的QLC产品都有什么样的特性呢?本文就和你一起来了解一下。
目前我们在市场上看到的NANDSSD以SLC、MLC和TLC为主。从名称来说,SLC,也就是Single-LevelCell,单倍单元。MLC是指Multi-LevelCell,字面意思是多倍单元,实际上是指2倍。TLC是指Trinary-LevelCell,也就是三倍单元。
从存储能力来看的话,SLC每单元只存储1bit数据(单倍),存储能力最差,但是速度和寿命最好,价格最为昂贵。MLC则是2bit(2倍),有一定改进,速度和寿命表现也不错,价格也比较贵;TLC则更强(3倍),每单元可以存储3bit数据,速度和寿命表现一般,价格便宜不少。
除了上述三种常见的颗粒外,目前市场上正在准备上市的新品QLC,全称是Quad-LevelCell,字面意思是4倍单元,也就是每单元可以存储4bit数据。换句话来说,在条件相当的情况下,QLC的颗粒存储能力比TLC大了33%,是MLC的2倍,是SLC的4倍。QLC在手,TB级别SSD不是梦。
从这一点来看,QLC似乎很有发展前途,但是QLC迟迟不上市的原因也很简单,那就是它的寿命情况表现不佳,性能也不如前辈们。那么,NAND颗粒为什么会有SLC、MLC和TLC的差异呢?新登场的QLC到底Q在哪里呢?为什么大家对它的寿命、性能充满担忧呢?
电子、浮栅、磨损——从NAND颗粒本身谈起
为了解释QLC为什么会有这样的问题,本文要先绕一个大弯子,从NAND颗粒的结构开始分析。这一部分内容,在本刊之前的文章中也有解释,在本文中我们需要再度解读一下。只有经过这一部分的解读,我们才会更为深刻地理解为什么QLC寿命低、速度慢,人们应该如何做出针对性的改进。
NAND单元的基本结构
以最常见的N沟道耗尽型MOSFET为例,如果定义单一存储单元的门控部分是最上层的话(顶部),那么门控部分下方是两个绝缘的ONO(oxide-nitride-oxide,氧化物-氮化物-氧化物),也被称作InterPolyDielectric(简写为IPD)所隔开的浮栅(FloatGate),再下方则是隧道氧化物(TunnelOxide)以及硅底。门控和浮栅之所以如此设计,是因为需要获得最大的电容值。因为栅极之间的电容是NAND工作的关键因素,通过门控可以控制浮栅。
▲N沟道耗尽型MOSFET的示意图,这张图对理解NAND芯片为什么不能继续使用更先进、更微小的工艺至关重要。
▲显微镜下的N沟道耗尽型MOSFET,尤其注意ONO部分以及包夹在ONO部分中的FloatingGate浮栅。
▲字线和位线,这张图也可以想象成一个俯视图:红色的字线,是N沟道耗尽型MOSFET的顶部,蓝色的是位线,是N沟道耗尽型MOSFET的底部。
在了解NAND单元的基本结构后,还需要了解字线和位线的概念,有关字线和位线,可以被类比为地图表面的经线和纬线,利用这两条线的交叉点才能确定一个存储单元的实际位置。
NAND单元如何读写数据
根据英特尔的资料,在实际操作中,当人们对使用25nm工艺制造的NAND基本存储单元进行操作时,会使用大约20V的电压加载到该单元所在的字线上。由于字线的连通性,这条字线的所有单元都会获得20V的电压。在这种情况下,除了所选单元的位线外,其余所有单元的位线都会被施加大约6V的电压,而目标单元的位线电压为0V。
▲NAND工作流程示意图
这样一来,目标单元的电压差超过阀值,电子能够穿过隧道氧化物流入浮栅,从而对单元的存储表征进行改变。此时,其余的单元由于存在20V字线、6V位线的电压,因此增加了位线和浮栅之间的电容,且相对电压较低,电子不能穿过隧道氧化物,所以单元没有任何变化。
当一个基本单元写入了数据后,如果要读取它,那么可以测量这个单元对应的字线和位线之间的电压。这是因为写入数据时,电子流入浮栅后形成了电压,字线和位线之间的电压就可以用于确定是否存在数据、对应怎样的数值。
此外,当人们需要清空数据时,可以对单元进行反向操作,比如将字线设置为0V,位线设置为20V,这样浮栅中的电子就会回流,流入位线或者硅底,最终会清空NAND单元中的数据,使得单元空置。
▲几种不同的NAND工作时电压状态,从上向下分别为每个NAND存储单元存储一个数据的SLC、存储2个数据的MLC、存储3个数据的TLC和存储4个数据的QLC单元。
结合使用上述方法,人们可以快速、简单地存储、读取数据。但是这种方法也存在致命的问题,那就是每次写入、擦除数据的时候,都需要较高电压才能完成。周围的绝缘层(比如在浮栅上下的ONO和隧道氧化物),在每一个高电压周期都会被“磨损”,也就是材料对电子的控制能力会变弱,这会使得这些材料失去绝缘性,最终电子会逃脱浮栅,电压状态会发生变化。这是NAND颗粒的本身原理所决定的,不会随着存储方式改变而改变,但人们可以不断改用新的材料和技术提高NAND颗粒的抗磨损能力,从而提高单元寿命。
差值决定寿命——QLC的桎梏
在前文,我们知道了NAND确定是否存在数据的方法是使用电压来衡量。如果浮栅的电压无法维持固定的值,那么单元会表现出错误的数据值,且随着擦写次数增多,浮栅储存电荷的能力就会不断下降,随后颗粒电压会逐渐漂移。但是,不同的数据存储方式在应对电荷漂移时的结果完全不同。
SLC:电压差值巨大,容错能力极强
在SLC上,NAND只有两种状态,这两种状态之间的电压差值比较大,这意味着一些轻微的效率降低可能不会很快地影响到数据存储的有效性。SLC状态下的颗粒,只需要有2个工作状态就可以确定数据了。比如浮栅以电容拥有15V电压(估计值,实际可能随着工艺、材料差异有所不同)作为数据0,0V作为数据1的话,那么两个状态之间存在巨大的差距使得任何测量设备都无法忽视,即使出现点问题也不是很难处理。
▲SLCNAND由于性能强劲,目前主要被用做缓存或者高端数据存储设备。
假设SLC一开始单元中可以维持较高的电压差值,随着浮栅磨损电压差值逐渐漂移,只能以10V/3V甚至6V/2V、4V/1V进行判断,这在理论上也是完全可行的。足够高的电压差值使得SLC耐久性能极高,SLC的超长寿命正是来自于此。
MLC:状态变多,差值变小
同样的问题在MLC上就更复杂一些。假设依旧存在15V的电压差,MLC上判断数据状态也就是00,01,10,11四种状态,需要3个电压差才能确定。假设不同状态的电压差平均分布,那么MLC最理想状态下需要有四个状态,那就是15V、10V、5V、0V——相比SLC而言,MLC的两个相邻状态之间的电压差急剧缩小,只有5V(SLC则高达15V)。
从结构上来看,MLC的颗粒和SLC颗粒不存在任何差异,都会由于浮栅中电子不断逃逸而最终导致电压值变得不那么明显,SLC的“数据差值”高达15V,MLC只有5V的话,可能MLC经过长时间磨损后达到10V、8V、6V、3V时表征4个状态就已经很勉强了,如果继续磨损的话,MLC颗粒就可能无法清楚地表征4个状态从而走向报废的边缘。
TLC:8个状态,差值急剧萎缩
继续看TLC的话,需要表征8种状态,每种状态代表3bit信息,分别是,,,,,,,,单元还是那个单元,但是电压状态更多了,在15V的范围内,存在8种状态会导致每种状态的电压差急剧缩小,平均只有大约不到2V,磨损导致电压漂移的空间极小。
TLC这种极小的电压差,使得单元在长期使用后只要稍微出现电压漂移,就可能发生状态之间的“纠缠”,因此早期TLC的P/E寿命只有~次,也就是TLC颗粒只能抵抗~次彻底读取、清除数据的循环。但是随着技术不断改进,TLC的寿命也在增加,目前已经普遍提高到~1次左右。
▲三星3DTLCNAND颗粒是市场常见的产品。
QLC:16个状态,挑战存储的极限
最后来看QLC的话,需要表征16种状态,也就是每种状态代表4bit信息,在15V电压内,16种状态之间的电压差大约只有1V,这使得本来就不够耐久的电子磨损效应非常明显,从而导致电压漂移的NAND颗粒读写次数变得极为有限,部分数据显示早期QLC颗粒只有大约次P/E全周期循环寿命,这个问题是否无解呢?我们下文再来研究这个问题。
▲需要存储16个状态,QLC堪称存储的极限。
技术进步,问题解决——QLC发展的曙光
绕了一个大圈子,我们回到QLC上来。上文已经从理论上分析了为什么从SLC到QLC,预期寿命一路下降在结构和设计上的根本原因。从文中可知,QLC容量大是有代价的,那就是存储更多的电压值来表征数据,这使得QLC的稳定状态岌岌可危。
那么是不是实际产品中寿命正如文中分析呢?答案是否定的。原因是文中的分析值得是在技术不变的情况下,不同类型的产品存在的寿命差异。但是由于MLC尤其是TLC在快速成为主流,大量延寿方案和技术的应用,尤其是堆叠工艺的加入,使得QLC这样的产品寿命已经不是难题。
从NAND颗粒的原理来看,浮栅存储电子,其周围的ONO和隧道氧化物提供绝缘性。在较老的工艺下,ONO和隧道氧化物厚度更厚、尺寸更大,绝缘性能更好,较新的15、16nm等工艺下则相反。但是新工艺能有效缩减NAND的尺寸从而提高单位面积数据存储密度,这就形成了一对矛盾。解决这对矛盾的办法就是堆叠技术。
堆叠技术使得人们可以使用40nm这样较老的工艺、通过多层堆积的方式提高单位数据密度。更老的工艺带来了更抗磨损的绝缘层,另外针对浮栅的改进也使得电子不那么容易逃逸。一个具体的例子就是TLC,在改用老制程、并改善材料绝缘性之后,之前TLC数百次的P/E寿命已经被提升至了平均~1次。
▲使用3D堆叠技术后,厂商对工艺的要求反而没有那么严苛了。
同理,相同的技术和工艺也可以使用在QLC单元上,通过堆叠技术和尺寸较大的工艺、新材料、新的读写算法等技术,目前英特尔和美光宣称QLC颗粒已经能够做到1个P/E循环。宣传归宣传,一些QLC产品厂商比如Maxio表示个P/E循环还是可以保证的,并且会随着未来发展进一步提升。
实际上,QLC颗粒单纯依靠存储单元本身的能力,已经很难保证数据存储的稳定性和可靠性了,对于这一点,制造商可能需要更为严苛的纠错算法来减少由于漂移引起的信号位错误,这些算法必须使用硬件来确保数据完整性,这可能会导致更高的功耗或者控制器中需要更多的晶体管。另外,额外的算法还可能带来性能的负面影响,但是会增加P/E,目前这类技术还需要进一步衡量。
性能方面,QLC由于需要一次写入、读取4bit数据,再加上电压控制要求很高,因此其速度表现目前是不如前辈MLC、TLC的,尤其是写入速度。一些测试数据和性能显示,QLC的读取速度可以基本做到和TLC持平,至少在SATA接口下能够达到MB/s以上。
▲QLC与TLC颗粒的规格对比,随着技术发展,QLC在写入能力上又有提升。
写入速度方面,目前部分厂商的产品宣称QLC大约是TLC的70%左右,可达到MB/s,但是另一些产品又证明其可以满足SATA接口MB/s的需求,这可能和厂商设计以及控制芯片相关。比较差的就是I/O性能了,QLC大概只有TLC的一半,延迟也略高一些,主要是P/E编程时间偏长。
TB级别容量——无可限量的未来
在解决了这些问题之后,QLC的真正实力也就是巨大的容量就开始逐渐爆发出来了。根据东芝的预测,QLCSSD主要应用在商业场合时,将位于HDD和高性能SSD之间,TB的QLCSSD性能和12台8TB的HDD硬盘阵列的性能相当,持续读取能力都是大约3GB/s,但是其SSD的待机功耗更低,更重要的是IOPS,HDD受制于先天结构,IOPS性能最多也就2左右,但是SSD即使是QLC颗粒,也能够达到50左右的性能水平,随机能力完胜HDD。
▲QLC相比HDD,还是有巨大优势的。
在这种情况下,东芝提出了一种方案,就是使用QLC的SSD作为HDD和高速SSD之间的缓冲,利用其大容量和较高的随机读写速度来提高系统的响应速度。这种应用方案对一些数据中心来说颇有吸引力,因为这些数据中心要求较高的IOPS和较大的存储容量,如果使用MLC或者TLC的SSD,那么成本会变得很高,使用HDD又达不到要求。
▲在东芝的想法中,QLC可以作为高速SSD和HDD之间的过渡阶层。
QLCSSD的出现,恰好能满足这类用户的需求。对于这一点,英特尔也表示出积极的态度。英特尔与美光面向企业级用户推出的3DQLCSSD采用的是WORM方式也就是Write-OnceleaRnMany一次写入多次读取。因为这类存储方式是大多数数据中心的首选,很多用户只是需要读取大量的数据,并不会经常改写它们。况且对数据中心来说,超大的容量带来了极大的空间自由,平衡读写技术能够在这里发挥得淋漓尽致,寿命也会得到最大限度的保证,QLC应用于数据中心真是恰到好处。
对普通玩家来说,QLC的SSD也可以作为大容量数据仓库替代HDD使用。美光之前预测,年普通玩家平均会有4块SSD,SSD的平均容量会达到GB,也就是每个人大约2.4TB容量。在这2.4TB的个人SSD中,可能只有GB/GB的SSD使用高速的MLC或者TLC,安装系统或者常用软件,剩余的1TB~2TB空间则由QLC接管,因为这部分内容读取居多,一般来说很少写入,可以完美发挥QLC的特性。
目前已经有厂商展示了QLCSSD的实际产品,来自于厂商Maxio,颗粒来源英特尔。Maxio是一家SSD控制芯片厂商,本次展示的是QLCSSD的开发原型。这款原型SSD驱动芯片基于MASA-B2C无DRAM控制器以及英特尔的N18A3DQLC颗粒,MASA-B2C具有两个处理内核,并支持一些厂商专有技术,包括AgileECC2,WriteBooster2(SLC缓存),虚拟奇偶校验恢复等。由于控制器采用了GlobalFoundries的40nm工艺,因此整体尺寸小巧,Maxio宣称其是最小巧的SSD控制器之一。
在寿命方面,正如前文所说,英特尔和美光宣称自己的产品P/E寿命有1次,但是Maxio表示实际情况并没有这么高,大约次左右,因为目前是早期开发状态,最终的版本还将有一定的提升。在DWPD(DeviceWritePerDay)也就是每天写入数据方面,这款SSD评级为0.3,这是一个典型的廉价SATASSD的评级,考虑到QLC的定位和海量的容量,这个问题对很多用户来说不是那么重要。
性能方面,Maxio的QLCSSD在使用SATA接口的情况下和TLC的SSD基本相当,读取和写入速度都突破了MB/s,4K随机写入能力也很强劲,显示出了这款控制芯片强劲的编程能力。另外,Maxio还宣称他们有另一颗芯片可以支持DRAM缓存,这样一来QLCSSD的寿命和性能还会有进一步提升。
▲QLCSSD的性能,目前已经基本赶上了SATA接口的TLCSSD。
Maxio还展示了一些实际产品的信息。整个4TB的QLCSSD采用了一块2.5英寸的PCB,上面只有寥寥4颗3DQLCSSD芯片,单颗芯片的存储容量高达1TB。考虑到这是一个早期工程样品,这意味着QLCSSD的容量潜力极为惊人。如果使用更大的3.5英寸PCB,双面布置总计16颗芯片的话,那么QLCSSD将会达到16TB的容量,这已经远远超过市场上所有的HDD了,当然价格也会高很多。
▲QLCSSD正面照片,依旧是工程样品。
▲Maxio展示的QLCSSD,采用英特尔N18A3DQLC颗粒。
总的来看,不管之前人们对QLC有多少的不满和误解,即使理论上4bit带来了非常狭小的磨损空间,但是QLC海量的存储能力和相对于TLC、MLC较低的价格会逐渐平衡这一切,尤其是在技术不断改善后,QLC也从“基本不可用”逐渐走向“水准之上”。特别是大量的市场对持续写入数据不那么敏感,只需要更大的空间、更快速的读取和更低的功耗时,这都是QLCSSD的机会。
可以预计的是,在未来1~2年左右,QLC就能够走入主流市场,玩家们很可能在QLCSSD中存储数百GB的4K高清视频或者超大的游戏文件,MLC或者TLC将接管系统和那些快速读写的领域,数据中心也将迎来QLC的大规模进驻,QLC的海量未来是深不可测的。