一文看懂存储级内存SCM

AI、实时分析、边缘计算和工业自动化正在改变数据中心的存储逻辑。过去很多系统设计里,DRAM 负责速度,NAND 闪存负责容量,中间的性能空档长期存在。存储级内存(SCM)要解决的正是这个问题:在 DRAM 与传统 NAND 之间提供一个低时延、非易失、可扩展的新层级。铠侠 XL-FLASH™ 基于 BiCS FLASH™ 3D 闪存技术,面向数据中心、云服务、企业服务器和边缘场景。

内存层级的老问题:DRAM 很快,但容量和成本都受限制

理解XL-FLASH 之前,要先看清楚计算系统里的内存层级。

在最靠近处理器的位置,是SRAM(静态随机存取存储器)和 DRAM(动态随机存取存储器)。它们的优势很明确:访问速度快,时延低,适合处理器频繁调用的数据。问题也同样明显:成本高,容量扩展受限制,断电后数据无法长期保留。

再往下,是TLC、QLC 这类 NAND 闪存。TLC 指每个存储单元存 3 比特,QLC 指每个存储单元存 4 比特。它们的优势是容量大、单位容量成本更低,适合做大规模数据存储。问题在于,相比 DRAM,传统 NAND 闪存的访问时延更高,也无法像主机内存那样被系统直接访问。

这就形成了一个很现实的系统设计矛盾:只堆DRAM,成本和容量都很难撑住;只靠传统 NAND,速度又可能跟不上实时分析、AI 推理、数据库事务和高频日志这类负载。

存储级内存(SCM)的价值,正是出现在这个中间层。

SCM 要填补的,是 DRAM 和传统 NAND 之间的性能空档

SCM可以简单理解为一种介于内存和存储之间的技术层级。它需要比传统闪存更快,同时保留 NAND 闪存的非易失特性。断电后数据还能保留,这是它和 DRAM 的重要区别。

铠侠对XL-FLASH 的定位也很清楚:它是一种低时延、高性能的闪存,目标是弥合 DRAM 这类易失性内存与现有闪存之间的性能空档。官方资料也提到,XL-FLASH 像其他闪存一样,在断开电源后仍然能够保留数据。

这对数据中心很重要。因为越来越多负载处在“既需要快,又需要大容量,还希望成本可控”的状态。比如实时数据库里的热数据、AI 系统中的频繁访问数据、边缘设备上的本地模型和日志数据,都不太适合简单地用“DRAM 或普通 SSD”二选一来处理。

XL-FLASH 的关键:低时延、高耐久、可扩展

XL-FLASH的核心优势可以概括为三点:低时延、高耐久和可扩展。

首先是低时延。官方资料显示,XL-FLASH的读取时延低于 5 微秒,并且采用 4KB 页大小,以提升操作系统读写效率。它还采用 16 平面架构来改善时延表现,字线和位线以更短维度寻址,并对电路结构进行优化,从而降低读写时延。

其次是高耐久。很多SCM 目标负载都有明显的写入密集特点,比如日志记录、监控数据、工业设备状态采集、医疗监测数据写入等。铠侠官方资料也强调,XL-FLASH 以高单元可靠性设计,支持写入密集型应用。

第三是可扩展。XL-FLASH基于铠侠 BiCS FLASH™ 3D 闪存技术,具备 NAND 路线的容量扩展潜力。第二代 XL-FLASH 增加了 MLC 功能,也就是每个单元存储 2 比特,在原有 SLC 形态之外进一步降低比特成本;同时可并行工作的平面数量也有所增加,有助于提升吞吐。第二代 XL-FLASH 的容量为 256Gb,面向数据中心、企业服务器和存储系统。

这也是它和单纯追求极致速度的内存技术不同的地方。XL-FLASH的重点不是只把速度推高,而是在速度、容量、成本和非易失性之间找到更适合现代数据中心的平衡点。

CXL 让“内存扩展”这件事变得更有想象空间

CXL是一种面向处理器、内存扩展和加速器的缓存一致性互连标准。CXL Consortium 对它的定义是:它可以在 CPU 内存空间和连接设备上的内存之间维持内存一致性,从而支持资源共享,并提升性能、降低软件栈复杂度和整体系统成本。

这对SCM 特别关键。因为当 XL-FLASH 这类低时延非易失存储可以通过 CXL 这类接口被系统更接近“内存扩展”的方式访问时,它的意义就不只停留在“更快的存储”。它有机会进入更靠近 CPU、GPU 和加速器的数据路径,承接过去只能依赖昂贵 DRAM 或 HBM 的一部分数据访问需求。

铠侠早在第二代XL-FLASH 就提到,未来可能将其应用于 CXL 场景。 这也说明,XL-FLASH 的价值不只在单颗存储介质本身,更在于它可以成为新一代内存层级设计的一部分。

什么场景需要XL-FLASH 这类 SCM

从应用上看,XL-FLASH适合的不是普通冷数据归档,而是那些访问频率高、对时延敏感、写入压力大,同时又需要更大容量的数据场景。

第一个典型场景是超大规模数据中心。云服务、实时数据库、大规模AI/机器学习部署里,经常会有一部分“热数据”被频繁访问。这类数据放在普通 NAND 上可能不够快,全部放在 DRAM 里成本又太高。XL-FLASH 这样的 SCM 可以提供一个高性能层级,让系统在容量和速度之间有更多选择。XL-FLASH 可为热数据提供高性能层级,服务云环境、实时数据库和大规模 AI/机器学习部署。

第二个场景是边缘AI 和边缘计算。机器人、医疗设备、制造业设备有一个共同特点:很多时候不能完全依赖云端。网络可能不稳定,数据也可能因为隐私、安全或实时性原因必须在本地处理。XL-FLASH 这类本地高速非易失内存,可以让边缘设备直接基于本地大数据集进行快速判断。在机器人、医疗设备和制造业中,XL-FLASH 可以支持边缘侧基于大型数据集进行快速决策。

第三个场景是写入密集型应用。比如视频监控、数字健康监测、边缘日志记录,数据会持续产生,而且需要实时写入和处理。如果存储介质耐久性不足,长期稳定性就会成为风险。XL-FLASH的高耐久和低时延,正适合承接这类连续数据采集与处理负载。

AI系统里的数据访问模式越来越复杂,尤其在大模型推理、长上下文、KV Cache(键值缓存)、RAG(检索增强生成)和向量检索场景里,频繁的小块随机访问会越来越多。传统 SSD 更擅长大块顺序读写,而 AI 推理里的很多访问请求更碎、更频繁、更靠近实时路径。XL-FLASH 这类低时延 SCM 技术的价值会更加被放大。

存储层级正在变得更细,系统设计也会更灵活

未来的数据中心不会只靠一种存储介质解决所有问题。更合理的方向,是让不同层级各司其职。

DRAM继续承担极低时延的主内存任务。HBM(高带宽存储器)继续服务 GPU 侧的高带宽访问。TLC、QLC NAND 继续承担大容量存储和成本敏感型数据承载。XL-FLASH 这类 SCM,则可以在 DRAM/HBM 与传统 NAND 之间,补上一个低时延、非易失、容量更可扩展的新层级。

这种分层会让系统设计更细,也更贴近真实负载。高频访问的数据可以放在更快层级,冷数据可以放在更高容量、更低成本的层级,写入密集和实时处理数据则可以交给更适合耐久与低时延的介质。

从这个角度看,XL-FLASH的价值不只是“闪存更快了”。它更像是在提醒整个行业:当 AI、自动化和实时分析成为基础负载后,数据中心的瓶颈会从单点性能,转向整个数据路径的协同能力。

真正重要的,是让数据在正确的位置、以合适的速度被访问。铠侠XL-FLASH 这类 SCM 技术,正在成为这套新内存层级里的关键拼图。

文章来源:KIOXIA铠侠中国社