从2D到3D NAND:存储技术演进、控制器挑战与未来展望
1. 从平面到立体一场关于存储密度的极限博弈十多年前当道格·黄Doug Wong在EE Times的访谈中谈及存储行业的未来时他描绘的图景在今天看来许多已成为现实而另一些则仍在深刻的演进之中。那次对话的核心直指一个困扰半导体行业数十年的根本矛盾在物理法则的铜墙铁壁前我们如何持续为世界提供更便宜、更快、更可靠的记忆体这不仅仅是东芝一家公司面临的问题而是整个信息时代的基石所承受的压力。从PC到移动设备的浪潮将NAND闪存推向了舞台中央但光刻机镜头下的晶体管尺寸已逼近原子尺度平面2D微缩的“免费午餐”显然快要吃完了。当时业界讨论的焦点——是继续在二维平面上“螺蛳壳里做道场”还是勇敢地迈向第三维度——如今已有了明确的答案但其背后的技术权衡、商业逻辑与工程挑战依然值得每一位硬件工程师、产品经理乃至科技爱好者深思。这不仅是关于“怎么做”的技术手册更是关于“为什么这么做”的战略推演。2. 平面NAND的黄昏微缩瓶颈与控制器竞赛2.1 光刻微缩的物理与工程之墙道格·黄在访谈中明确指出NAND闪存一直是半导体行业光刻技术微缩的先锋。这很好理解存储芯片的核心价值在于单位面积内能塞进多少比特bit密度直接与成本挂钩。通过将制程节点从早期的微米级推进到当时的19nm乃至后来的1x nm、1y nm比特成本得以指数级下降。他举了一个生动的例子最初2MB16Mb的芯片售价约20美元而到2013年同样的20美元能买到约30GB的容量。计算一下容量提升了约15000倍但价格不变这背后的驱动力主要就是光刻微缩和单元架构如从SLC到MLC、TLC的演进。然而他话锋一转点出了微缩放缓的现实。这不仅仅是“工程师不够聪明”的问题而是多重挑战的叠加理论物理极限访谈中提到的“栅极不能无限小”是关键。在浮栅型Floating GateNAND中信息通过存储在浮栅上的电子数量来表征。当晶体管的物理尺寸小到一定程度浮栅可能只容纳几十个甚至几个电子。此时电子数量的随机波动比如由于隧穿效应或热噪声丢失几个电子就足以导致数据误判可靠性急剧下降。这不再是工艺问题而是量子物理开始“发言”了。制程技术瓶颈道格提到了极紫外光刻EUV。在2013年EUV被视为延续摩尔定律的救星但因其光源功率、掩膜版缺陷率等问题“不断被推迟”。事实上EUV直到2019年前后才在逻辑芯片制造中实现大规模量产用于NAND则更晚。在EUV成熟之前行业依靠多重曝光Multi-Patterning等复杂且昂贵的技术来推动微缩这显著增加了制造成本和工艺难度。耐久力Endurance的权衡这是消费者不易感知但至关重要的参数。每次对NAND单元进行编程写或擦除都会对氧化层造成微小的损伤。随着单元尺寸缩小这种损伤效应愈发明显。道格提到当时的2D MLC NAND可承受约3000次编程/擦除循环。如果应用场景对写入次数需求降低例如主要用于存储静态内容那么微缩或许还能继续。但现实是随着SSD取代硬盘成为系统盘操作系统和应用的频繁读写对耐久力提出了更高要求。注意这里存在一个常见的认知误区。很多人认为工艺越先进nm数字越小闪存性能就一定越好。实际上对于NAND更先进的工艺主要带来更高的密度和更低的比特成本但往往伴随着原始误码率Raw Bit Error Rate, RBER的升高和耐久力的潜在下降。性能速度和可靠性更多地由闪存架构如全页/半页编程、接口协议如NVMe以及控制器决定。2.2 被忽视的关键角色存储控制器道格·黄抛出了一个至关重要的观点“最大的问题……是人们是否在他们的处理器上拥有足够强大的[纠错码]引擎来应对最新的NAND” 这句话点出了存储系统的一个核心矛盾闪存原厂与控制器设计商之间的“龟兔赛跑”。NAND的“不完美”特性随着微缩NAND存储单元的物理特性会变化导致更高的原始误码率RBER读取时出错的比特更多。更严重的读写干扰对一个单元进行操作会影响相邻单元的电平。更长的读写延迟某些操作如擦除可能变慢。控制器的救赎控制器Controller或主控SoC是闪存与主机系统之间的桥梁。它的核心任务之一就是通过强大的纠错码ECC算法、磨损均衡Wear Leveling、坏块管理Bad Block Management、读写重试Read Retry等一系列固件算法来“掩盖”NAND的物理缺陷向上层呈现一个稳定、可靠、快速的逻辑块设备。节奏错配的挑战道格指出闪存制造商可以快速推进到新的制程节点但控制器的设计周期往往更长且不一定能与NAND新品发布同步。一款新的、更“脆弱”的NAND需要更强的ECC如从BCH码升级到LDPC码而开发并验证一套新的LDPC引擎需要时间。如果控制器没准备好再先进的NAND也无法稳定工作。实操心得在选择SSD或eMMC/UFS等存储方案时不要只看闪存颗粒的制程例如是19nm还是15nm。同样重要甚至更重要的是主控芯片的型号和厂商的固件调校能力。一个成熟稳健的主控配稍旧制程的颗粒其实际体验和可靠性可能远胜于新制程颗粒搭配不成熟的主控。这也是为什么一些高端消费级和企业级SSD会强调其自研主控和固件算法的原因。3. 破局之路三维堆叠与下一代存储技术当平面微缩步履维艰时行业自然将目光投向了垂直维度。道格·黄在访谈中清晰地指出了东芝当时的两大技术方向3D NAND和新型非易失性存储器如ReRAM和MRAM。3.1 3D NAND从“平房”到“摩天大楼”3D NAND的理念非常直观既然在XY平面上缩小晶体管越来越难、越来越贵那就在Z轴上堆叠起来。传统的2D NAND是“平房”所有存储单元都建在硅基底这一层。3D NAND则是“摩天大楼”通过沉积、蚀刻等工艺在垂直方向堆叠数十甚至上百层存储单元。3D NAND带来的核心优势摆脱光刻微缩依赖单元尺寸可以做得相对宽松例如40nm级别从而大幅提升耐久力和数据保持力。密度提升主要通过增加堆叠层数来实现这比推进光刻节点在成本和可行性上更具优势。更高的存储密度这是最直接的收益。通过堆叠单位芯片面积上的比特数得以倍增。潜在的性能优化由于不再追求极限微缩电荷捕获层Charge Trap Layer现代3D NAND多采用CTF结构而非传统浮栅可以设计得更稳健有助于改善读写速度。3D NAND面临的严峻挑战2013年视角制造成本这是访谈中记者尖锐提问的核心。建造“摩天大楼”的工艺如高深宽比的通道孔蚀刻、多层薄膜的均匀沉积远比盖“平房”复杂。初期3D NAND的晶圆成本可能高于最先进的2D NAND。道格·黄的回应体现了半导体行业的商业智慧消费者只为价值买单而非技术本身。他的计算表明历史上比特成本的下降速度甚至快于光刻微缩带来的密度提升速度这得益于自动化、晶圆尺寸增大从8寸到12寸和良率提升。对于3D NAND目标同样是通过工艺成熟、规模效应和架构优化使其比特成本最终低于2D NAND的极限。事实证明他预判正确如今3D NAND已成为绝对主流。工艺复杂性如何在上百层结构中精确地刻蚀出贯穿所有层的垂直通道孔如何保证每一层存储单元的电气特性均匀一致如何管理堆叠后产生的巨大应力这些都是需要攻克的核心工程难题。3.2 下一代非易失性存储技术ReRAM与MRAM除了在现有技术上做延伸道格·黄也展望了可能颠覆格局的新技术。他将ReRAM阻变存储器和MRAM磁阻随机存储器列为“未来的领跑者”。ReRAM利用材料如金属氧化物在不同电阻态之间切换来存储数据。其优势在于结构相对简单读写速度快功耗低且具备良好的微缩潜力。它被视为可能替代NAND用于高密度存储的候选者也适合用于存算一体等新兴架构。MRAM利用电子自旋的磁矩方向来存储信息。道格特别强调了MRAM的无限耐久性和高速读写特性接近DRAM速度。这带来了一个革命性的系统架构想象消除存储层级。当前系统架构的瓶颈在现有计算机架构中CPU从高速但易失的DRAM中取指令和数据。DRAM的内容在断电后丢失因此系统启动时需要从非易失但较慢的NAND或硬盘中将操作系统和程序“加载”Shadow到DRAM中。这个过程耗时且增加了系统复杂度。MRAM带来的范式变革如果有一种存储器既能像NAND一样断电不丢失数据非易失又能像DRAM一样快速读写且寿命极长那么DRAM和NAND的界限就可能模糊。道格设想有了MRAM或许就不再需要“加载”这一步了——数据始终就在那里开机即用。这不仅能极大加快系统启动和响应速度还能简化内存子系统设计降低整体功耗。注意道格也提到了一个关键点“读耐久性并非无关紧要”。对于MRAM虽然写操作几乎不磨损但频繁的读操作可能会对相邻单元产生干扰读干扰这需要通过电路设计和纠错来管理。任何新技术在带来优势的同时都会引入新的挑战。为什么不是PCM、FeRAM访谈后的读者评论中有人问为何未提及相变存储器PCM和铁电存储器FeRAM。这反映了当时的技术格局。PCM虽然成熟较早如英特尔傲腾技术基于的3D XPoint本质是PCM变种但在成本、密度和 scalability 方面面临挑战。FeRAM则受限于材料极化疲劳和微缩难度。道格的回答以及当时行业研讨会的论文分布表明在2013年的时间点上基于综合评估密度、速度、耐久力、制程兼容性、成本潜力3D NAND、ReRAM和MRAM是资源投入和业界看好的主要方向。4. 从技术蓝图到商业现实十年后的回望与当前挑战站在今天回顾2013年的这场对话我们可以清晰地看到技术路线的演进与市场的选择。4.1 3D NAND从概念到统治地位东芝现为铠侠及其合作伙伴西部数据以及三星、SK海力士、美光等厂商成功将3D NAND推向了大规模量产。堆叠层数从最初的24层、32层一路攀升至目前的200层以上甚至向500层迈进。道格关于“通过3D技术延续密度提升并控制成本”的预测已成现实。3D NAND不仅成为了消费级SSD、手机存储的标配也彻底占据了企业级存储市场。当前3D NAND的核心竞赛点堆叠层数与单元结构层数竞赛仍在继续但单纯堆高会面临工艺复杂度、良率和成本的非线性上升。因此厂商同时致力于单元架构的革新例如电荷捕获型CTF取代浮栅FG已成为主流因其在3D结构中的可制造性和可靠性更优。串堆叠String Stacking将存储单元串在垂直方向上进行多次堆叠是突破单次工艺堆叠层数限制的关键技术。四层单元QLC甚至五层单元PLC在每单元存储更多比特4bit或5bit进一步提升密度但以牺牲耐久力和性能为代价适用于冷数据存储。接口与性能NAND的接口速度也在飞速提升从早期的SATA到PCIe Gen3/Gen4/Gen5配合NVMe协议使得SSD的峰值带宽从几百MB/s提升到超过10GB/s。控制器技术尤其是LDPC纠错、独立NAND通道管理和多核处理器变得空前重要。4.2 下一代存储MRAM与CXL的融合MRAM的发展路径与当初的设想略有不同但前景依然广阔。目前基于自旋转移矩STT-MRAM的器件已实现量产主要应用于嵌入式领域作为微控制器MCU中的非易失性内存替代eFlash用于物联网设备、汽车电子等提供高速、高耐久性的代码存储。缓存/缓冲器作为SSD或DRAM的缓存利用其非易失性在意外断电时保护数据。而道格所设想的“取代DRAM”的愿景正通过存储级内存Storage-Class Memory, SCM的概念和Compute Express Link (CXL)互联协议逐步实现。英特尔的傲腾持久内存基于3D XPoint一种与PCM相关的技术是早期的SCM尝试。如今行业正探索将MRAM、ReRAM等与CXL结合创造出既能按字节寻址像内存、又具备非易失性和大容量像存储的新型层级真正打破内存与存储的鸿沟。4.3 持续存在的挑战与工程师的应对尽管技术取得了巨大进步但道格·黄当年提及的一些根本性挑战依然存在只是形式发生了变化可靠性管理对于QLC/PLC NAND原始误码率更高对ECC的要求达到了新的高度。先进的LDPC纠错、基于人工智能的读电压校准、更精细的磨损均衡和垃圾回收算法是控制器固件开发的核心战场。功耗与散热高性能PCIe Gen5 SSD的功耗可达10瓦以上散热成为高端产品设计的瓶颈。如何平衡性能、功耗和温度是系统级设计的关键。安全与数据完整性从硬件加密引擎到固件信任根RoT存储设备的安全性要求日益提高防止物理攻击和固件篡改。软硬件协同设计随着CXL等新互联标准的出现存储不再是一个独立的“黑盒”。如何让主机处理器更高效地管理、访问SCM需要从操作系统、驱动程序到应用软件的全面优化。给工程师和开发者的建议关注存储介质特性开发数据库、文件系统或任何I/O密集型应用时需要了解底层存储是SATA SSD还是NVMe SSD是TLC还是QLC的基本特性如读写延迟、4K随机性能、顺序带宽等以便进行针对性优化。理解持久化模型随着SCM和MRAM等非易失内存的兴起传统的以块或文件为单位的I/O模型可能会演进。关注如PMDK持久化内存开发套件这样的编程模型为未来的存储层级变革做好准备。系统级视角存储性能瓶颈往往不在存储设备本身而在主机接口PCIe通道数、总线带宽、驱动程序效率乃至应用程序的I/O模式。进行全链路性能剖析至关重要。5. 未来展望超越微缩的存储创新存储技术的未来将不再仅仅是关于“如何把单元做得更小或堆得更高”而是围绕异构集成、智能管理和新计算范式展开。存算一体In-Memory Computing这是ReRAM等新型存储器的一大用武之地。利用电阻器件的模拟特性直接在存储单元内进行矩阵乘加等运算可以极大地加速人工智能推理等任务突破“内存墙”限制。这需要存储器件、电路设计和算法模型的深度融合。晶圆级集成与先进封装通过硅通孔TSV、混合键合Hybrid Bonding等先进封装技术将NAND裸片、控制器裸片、甚至DRAM裸片以3D方式集成在一起可以大幅提升带宽、降低功耗、减小体积。这被称为“3D系统集成”是超越“3D NAND”的下一步。材料与器件创新寻找新的电荷捕获材料、探索铁电晶体管FeFET等全新器件原理可能为NAND带来新的生命。而在MRAM方向基于自旋轨道矩SOT或拓扑绝缘体的新结构有望进一步降低写入电流提升速度。以数据为中心的架构随着CXL协议的普及内存和存储的界限将进一步模糊形成可动态配置的“内存池”和“存储池”。系统架构将从“以CPU为中心”转向“以数据为中心”计算资源被动态调度到数据所在的位置而非相反。回望2013年道格·黄的分享其价值在于清晰地勾勒了存储行业在面临物理极限时的战略思考框架在现有技术上深度优化如强化ECC控制器开辟新的维度寻求突破3D堆叠并积极探索颠覆性的替代方案MRAM/ReRAM。这条路径至今依然指导着存储行业的发展。对于身处其中的工程师而言理解这些底层技术演进的逻辑比追逐某个具体的制程数字更为重要。因为决定最终产品竞争力的从来不是单一指标的领先而是在密度、性能、可靠性、功耗、成本这个多维魔方上找到的最佳平衡点。存储的故事远未结束它正从微观的器件物理走向宏观的系统架构革命而这场革命的核心始终是为了更高效地承载人类不断膨胀的数据与智慧。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2596561.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!